Probabilidad 

y 

Estadistica 

Aplicaciones 
y Metodos 




George C. Canavos 

www. FreeLibros. com 


PROBABILIDAD Y 
ESTADISTICA 
Aplicaciones y 
metodos 


George C. Canavos 

VIRGINIA COMMONWEALTH UNIVERSITY 


Traduction: 

Edmundo Gerardo Urbina Medal 
Departamento de Ingenieria Electrica 
UAM Ixtapalapa 

Revision Tecnica: 

Gustavo Javier Valencia Ramirez 
Doctor en Matem&ticas 
Profesor Titular 
Departamento de Matematicas 
Facultad de Ciencias 
UNAM 



MEXICO • BUENOS AIRES • CARACAS • GUATEMALA 
LISBOA • MADRID • NUEVA YORK • PANAMA • SAN JUAN 
SANTAF& DE BOGOTA • SANTIAGO • SAO PAULO 
AUCKLAND • HAMBURGO • LONDRES • MILAN • MONTREAL 
NUEVA DELHI • PARfS • SAN FRANCISCO • SINGAPUR 
ST. LOUIS • SIDNEY • TOKIO • TORONTO 

www. FreeLibros. com 



PROBABILIDAD Y ESTADlSTICA 
Aplicaciones y me tod os 

Prohibtda la reproduce ion total o parctai da esta obra, 
por cualquier medio, sin autorizacion escr'rta del editor. 

DERECHOS RESERVADOS © 1988, respecto a la primera edition en espafiol por 
McGRAW-HILL/INTERAMERICANA DE MEXICO, S.A. DE C.V. 

Atlacomulco 499-501, Fracc. Industrial San Andres Atoto 
53500 Naucalpan de Juarez, Edo. de Mexico 

Miembro de la Camara National de la Induttria Editorial, Reg. Num. 1890 

ISBN 968-451-856-0 

Traducido de la primera edicidn en ingles de 

APPLIED PROBABILITY AND STATISTICAL METHODS 

Copyright © MCMLXXXIV, by George C. Canavos 
ISBN 0-316-12778-7 

1203456789 P.E.-87 9076543218 

• bnpreso en Mexico 

Esta Obra se termini de 
wtwmir en Enero de 19S8 en 
Programgs Educattvos, S.A. de C.V.. 

Cab Chabactno No. 6S-A tot. Asturias’ 

Oetagaciin Cuauhtemoc A.!j i ’■■ ■'• -V 
. CJ>. 06850 Mdsico. DJ. ■ . , 

Empresa Cetdficeda por el '' ; ’ 

InsMuto Mexicano de NormatbackSn 
/ CertHicacidn A.C. bajo la Norma 
ISO-9002: 1994NMX-CC-004:1995 1 ’ 

con el Num. de Rejistro ft SC-048 

Setiraron 2500 ejemplares WWW.FreeUbrOS.COITI 


Printed in Mexico 

• \ i 



A mi madre, 

y a Athena, Alexis y Costa 


www. FreeLibros. com 



Contenido 


CAPITULO UNO 

Introduccion y estadistica descriptiva 1 

1.1 Introduccion 1 

1.2 Descripci6n grafica de los datos 3 

1.3 Medidas numericas descriptivas 11 

Referenda 22 
Ejerddos 22 

Apendice: Sumatorias y otras notadones simbdlicas 25 


CAPITULO DOS 

Conceptos en probabilidad 28 

2.1 Introduccidn 28 

2.2 La definicidn cl&sica de probabilidad 29 

2.3 Definicidn de probabilidad como frecuencia relativa 

2.4 Interpretacidn subjetiva de la probabilidad 31 

2.5 Desarrollo axiom&tico de la probabilidad 32 

2.6 Probabilidades conjunta, marginal y condicional 36 

2.7 Eventos estadisticamente independientes 41 

2.8 El teorema de Bayes 43 

2.9 Permutaciones y combinaciones * 45 

Referendas 48 

Ejerddos 48 

www. FreeLibros. com 



viii Contenido 


CAP1TUL0 TRES 

Variables aieatorias y distribuciones de probabilidad 52 

3.1 El concepto de variable aleatoria 52 

3.2 Distribuciones de probabilidad de variables aieatorias discretas 53 

3.3 Distribuciones de probabilidad de variables aieatorias 
continuas 57 

3.4 Valor esperado de una variable aleatoria 62 

3.5 Momentos de una variable aleatoria 67 

3.6 Otras medidas de tendencia central y dispersion 75 

3.7 Funciones generadoras de momentos 80 

Referencias 84 
Ejercicios 84 


CAPITULO CUATRO 


Algunas distribuciones discretas de probabilidad 88 

4.1 Introduction 88 

4.2 La distribution binomial 89 

4.3 La distribution de Poisson 100 

4.4 La distribution hipergeometrica 108 

4.5 La distribution binomial negativa 115 

Referencias 121 
Ejercicios 122 

Apendice: Deduccidn de la funcidn d? p'obabilidad 
de Poisson 126 

Apindice: Demostracidn del teorema 4.1 128 


CAPiTULO CINCO 


Algunas distribuciones continuas de probabilidad 130 

5.1 Introduction 130 

5.2 La distribution normal 130 , 

5.3 La distribution uni forme • 143 

5.4 La distribution beta 147 

5.5 La distribution gama 152 

5.6 La distribution d^W^Fre^/ibrOS. CO/77 






Contenido ix 


5.7 La distribuci6n exponencial negativa 163 

5.8 La distribuci6n de una funcibn de variable aleatoria 167 

5.9 Conceptos basicos en la generacion de numeros aleatorios 
por computadora 171 

5.9.1 Distribution uniforme sobre el intervalo (a, b) 173 

5.9.2 La distribucibn de Weibull 173 

5.9.3 La distribucibn de Erlang 174 

5.9.4 La distribucibn normal 174 

5.9.5 La distribucibn binomial 174 

5.9.6 La distribucibn de Poisson 175 

Referencias 175 
Ejercicios 175 

Apendice: Demostracidn de que la expresidn (5.1) es una funcidn de 
densidad de probabilidad 181 
Apendice: Demostracidn del teorema 5.1 182 


CAPITULO SETS 


Distribuciones conjuntas de probabilidad 185 

6.1 Introduction 185 

6.2 Distribuciones de probabilidad bivariadas 185 

6.3 Distribuciones marginales de probabilidad 189 

6.4 Valores esperados y momentos para distribuciones bivariadas 191 

6.5 Variables aleatorias estadisticamente independientes 194 

6.6 Distribuciones de probabilidad condicional 197 

6.7 Analisis bayesiano: las distribuciones a priori y a posteriori 200 

6.8 La distribucibn normal bivariada 207 

Referencias 210 
Ejercicios 210 


CAPITULO SIETE 


Muestras aleatorias y distribuciones de muestreo 214 

7.1 Introduccibn 214 

7.2 Muestras aleatorias 214 

7.3 Distribuciones de muestreo de estadisticas 218 

7.4 La distribucibn de muestreo de X 209 

7.5 La distribucibn de muestreo de S 2 231 

7.« u. a^^^HkeLWos.com 





x Contenido 


1.1 La distribuci6n de la diferencia entre dos medias muestrales 238 
7.8 La distribution F 240 

Referencias 244 
Ejercicios 244 

Apendice: Demostracidn del teorema central del limite 247 
Apendice: Deduccidn de la funcidn de densidad de 
probabilidad t de Student 249 


CAPITULO OCHO 


EstimaciOn puntual y por interval*) 251 

8.1 Introduction 251 

8.2 Propiedades deseables de los estimadores puntuales 251 

8.2.1 Estimadores insesgados 255 

8.2.2 Estimadores consistentes 256 

8.2.3 Estimadores insesgados de varianza minima 259 

8.2.4 Estadisticas suficientes 261 

8.3 Metodos de estimation puntual 264 

8.3.1 Estimation por maxima verosimilitud 264 

8.3.2 MOtodo de los momentos 268 

8.3.3 EstimaciOn por maxima verosimilitud para muestras censuradas 

8.4 Estimation por intervalo 271 

8.4.1 Intervalos de confianza para p cuando se muestrea una 
distribution normal con varianza conocida 274 

8.4.2 Intervalos de confianza para p cuando se muestrea una 
distribution normal con varianza desconocida 277 

8.4.3 Intervalos de confianza para la diferencia de medias cuando 

se muestran dos distribuciones normales independientes 278 

8.4.4 Intervalos de confianza para a 1 cuando se muestrea una 
distribution normal con media desconocida 280 

8.4.5 Intervalos de confianza para el cociente de dos varianzas cuando 
se muestran dos distribuciones normales independientes 281 

8.4.6 Intervalos de confianza para el parimetro de proportion p 
cuando se muestrea una distribution binomial 282 

8.5 Estimation bayesiana 285 

8.5.1 EstimaciOn puntual bayesiana 286 

8.5.2 Estimation bayesiana por intervalo 288 

www. FreeLibros. com 


269 


Contenido xi 


8.6 Limites estadisticos de tolerancia 290 

8.6.1 Limites de tolerancia independientes de la distribution 290 

8.6.2 Limites de tolerancia cuando se muestrea 
una distribuci6n normal 293 

Referencias 294 
Ejercicios 294 


CAP1TULO NUEVE 


Prueba de hipdtesis estadisticas 303 

9.1 Introduction 303 

9.2 Conceptos b&sicos para la prueba de hipotesis estadisticas 303 

9.3 Tipos de regiones criticas y la funcibn de potencia 311 

9.4 Las mejores pruebas 314 

9.5 Principios generales para probar una H 0 simple contra una H t 
uni o bilateral 321 

9.5.1 Principios generales para el caso 1 323 

9.5.2 Principios generales para el caso 2 324 

9.5.3 Principios generales para el caso 3 325 

9.6 Prueba de hipotesis con respecto a las medias cuando se 

muestrean distribuciones normales 326 

9.6.1 Pruebas para una muestra 327 

9.6.2 Pruebas para dos muestras 333 

9.6.3 Reflexi6n sobre las suposiciones y sensitividad 338 

9.6.4 Prueba sobre las medias cuando las observaciones 

estim pareadas 340 

9.7 Pruebas de hipbtesis con respecto a las varianzas cuando se 

muestrean distribuciones normales 346 

9.7.1 Pruebas para una muestra 346 

9.7.2 Pruebas para dos muestras 348 

9.8 Inferencias con respecto A las proporciones de dos 
distribuciones binomiales independientes 350 

Referencias 353 

Ejerc icios 353 _ , 

www. FreeLibros. com 




XU s^uaientuu 


CAPITULO DIEZ _ . 

Pruebas de bondad de ajuste y analisis de tablas de contingencia 362 

10.1 Introducci6n 362 

10.2 La prueba de bondad de ajuste chi-cuadrada 363 

10.3 La estadistica de Kolmogorov-Smirnov 368 

10.4 La prueba chi-cuadrada para el analisis de tablas de 
contingencia con dos criterios de clasificacidn 370 
Referencias 374 

Ejercicios 374 


CAPITULO ONCE __ 

Metodos para el control de calidad y muestreo para aceptaddn 379 

11.1 Introducci6n 379 

11.2 Tablas de control estadistico 379 

11.2.1 Tablas X (media conocida de la poblaci6n) 381 

11.2.2 Tablas S (desviacidn estandar conocida de la poblacidn) 383 

11.2.3 Tablas X y S (media y varianza desconocidas de la poblacidn) 384 

11.3 Procedimientos del muestreo para aceptaci6n 388 

11.3.1 El desarrollo de planes de muestreo sencillos para riesgos 
estipulados del productor y del consumidor 392 

11.3.2 Muestreo para aceptacidn por variables 393 

11.3.3 Sistemas de planes de muestreo 396 
Referencias 396 

Ejercicios 397 


CAPITULO DOCE 


Diseio y analisis de experimentos estadisticos , ,401 

12.1 Introducci6n 401 

12.2 Experimentos estadisticos 401 

12.3 Diseoos estadistic <wwvfiFreeLibros.com 



Contenido xiti 


12.4 Analisis de experimentos unifactoriales en un diseflo 

completamente aleatorio 404 

12.4.1 Analisis de varianza para un modelo de efectos fijos 407 

12.4.2 Metodo de Scheffe para comparaciones multiples 413 

12.4.3 Andlisis de residuos y efectos de la violation de 
las suposiciones 415 

12.4.4 El caso de efectos aleatorios 418 

12.5 Analisis de experimentos con solo un factor en un diseflo en bloque 
completamente aleatorizado 420 

12.6 Experimentos factoriales 426 

Referencias 435 
Ejercicios 435 


CAPiXULO TRECE 


Analisis de regresion: el modelo lineal simple 443 

13.1 Introduction 443 

13.2 El significado de la regresidn y suposiciones basicas 444 

13.3 Estimacion por minimos cuadrados para el modelo lineal simple 448 

13.4 Estimacion por maxima verosimilitud para 
el modelo lineal simple 455 

13.5 Propiedades generales de los estimadores de minimos cuadrados 457 

13.6 Inferencia estadistica para el modelo lineal simple 465 

13.7 El uso del andlisis de varianza 470 

13.8 Correlaci6n lineal 477 

13.9 Series de tiempo y autocorrelaci6n 479 

13.9.1 Componentes de una serie de tiempo 479 

13.9.2 La estadistica de Durbin-Watson 480 

13.9.3 Eliminacidn de la autocorrelatidn mediante la transformation 

de datos 485 * 

13.10 Enfoque matricial para el modelo lineal simple 488 

Referencias 491 
Ejercicios 491 

Ap&ndice: Breve revisidn del Algebra de. matrices 497 

www. FreeLibros. com 




*iv Contenido 
CAPITULO CATORCE 

Analisis de regresion: el modelo lineal general 

14.1 Introduction 503 

14.2 El modelo lineal general 503 

14.3 Principio de la suma de cuadrados extra 513 

14.4 El problema de la multicolinealidad 520 

14.5 Determination del mejor conjunto de variables de prediction 525 

14.6 An&lisis de residuos o residuales 532 

14.7 Regresion polinomial 538 

14.8 Minimos cuadrados con factores de peso 547 

14.9 Variables indicadoras 556 

Referencias 563 
Ejercicios 563 


CAPITULO QUINCE 


M&todos no param6tricos 572 

15.1 Introduction 572 

15.2 Pruebas no parametricas para comparar dos poblaciones con base en 
muestras aleatorias independents 574 

15.2.1 Pnieba de Mann-Whitney 574 

15.2.2 Pnieba de tendentias de Wald-Wolfowitz 577 

15.3 Pruebas no parametricas para observaciones por pares 578 

15.3.1 La prueba del signo 579 

153.2 Prueba de rangos de signos de Wilcoxon 580 

* 15.4 Prueba de Kruskal-Wallis para k muestras aleatorias independientes 582 
15.5 Prueba de Friedman para k muestras igualadas 584 ' 

i 15.6 Coefitientc de correlation de rangos de Spearman 586 
15.7 Comentarios finales 588 

17. ■> fr-vr-t 

r • ■> Referencias 589 
Ejercicios 589 

www. FreeLibros. com 




Contenido xv 


APENDICE 

TABLA A 
TABLA B 
TABLA C 

TABLA D 

TABLA E 
TABLA F 
TABLA G 
TABLA H 

TABLA I 

TABLA J 

TABLA K 

Respuestas a 

Indice 647 


593 

Valores de la funciOn de distribution acumulativa binomial 594 
Valores de la funciOn de distribucion acumulativa de Poisson 602 
Valores de las funciones de probabilidad y de distribucion 
acumulativa para la distribution hipergeometrica 610 
Valores de la funciOn de distribucion acumulativa 
normal estandar 616 

Valores de cuantiles de la distribucion chi-cuadrada 619 

Valores de cuantiles de la distribution t de Student 621 

Valores de cuantiles de la distribuciOn F 623 

/r-valores para los limites de tolerancia bilaterales cuando se 

muestrean distribuciones normales 629 

^-valores para los limites de tolerancia unilaterales cuando se 

muestrean distribuciones normales 631 

Valores de cuantiles superiores de la distribuciOn de 

la estadistica D n de Kolmogorov-Smirnov 633 

Limites de la estadistica de Durbin-Watson 635 

los ejercicios seleccionados de numero impar 636 


www. FreeLibros. com 



Prefacio 


Este Iibro se plane6 como una introducci6n a la teoria de la probabilidad y a la infe- 
rencia estadistica, para toda persona interesada en las disciplinas aplicadas; econo- 
mia y finanzas, ingenieria y ciencias fisicas y de la vida. No es necesario ningun co- 
nocimiento previo de probabilidad y estadistica, aunque se espera que el lector se 
encuentre familiarizado con los fundamentos del calculo diferencial e integral. El 
libro hace hincapie en las aplicaciones. El rigor matem&tico se emplea unicamente 
con el fin de exponer las bases de la probabilidad y de la estadistica, lo que, en opi- 
ni6n del autor, es un ingrediente necesario para la aplicacibn efectiva de los meto- 
dos. El texto intenta proporcionar al estudiante un conocimiento que vaya mbs alia 
de lo superficial, sin abrumarlo con teoria excesiva. En este sentido, la obra brinda 
la oportunidad de reforzar el “porque”, ademas de presentarle el “como” de la 
aplicacibn. 

A traves del texto, cada concepto o metodo se ilustra con ejemplos reales que se 
expresan de manera que el lector pueda obtener una comprension intuitiva del con¬ 
cepto. La mayor parte del desarrollo de la inferencia estadistica se fundamenta en el 
punto de vista de la teoria del muestreo. Tambien se explora el enfoque bayesiano 
para dar la perspectiva adecuada. Asimismo, se estudian las suposiciones de los meto- 
dos estadlsticos y se dan respuestas a preguntas del tipo “que pasa si...” Ademas, en 
muchos ejemplos se emplearon paquetes de programas para computadora y tecnicas 
de simulation, con el proposito de ilustrar y reforzar los puntos presentados. 

El material que abarca el libro demuestra ser suficiente para realizar un curso de 
dos semestres sobre probabilidad y metodos estadisticos. Por otra parte, es posible re- 
ordenar el material y asi ofrecer variedad de cursos, como un curso de un semestre 
sobre distribuciones de probabilidad y sus aplicaciones, en el que se empleen los ca- 
pitulos 1 a 7; un curso de dos trimestres sobre los fundamentos de la probabilidad y 
de los mfctodos estadisticos, con los capitulos 1 a 10; o un curso en anblisis de varian- 
za y metodos de regresion, con los capitulos 9, 12, 13 y 14. El alcance de los temas 
que se tratan es amplio, extenso y proporcionan al profesor la oportunidad de recal¬ 
car ciertos temas u omitir otros. Que el libro pueda emplearse a nivel licenciatura o a 
nivel de graduados, depende tanto de las necesidades particulares como de los cono- 
cimientos previos de los lectores. 

Despu6s de un anblisis razonablemente completo sobre la estadistica descrip- 
tiva (Cap. 1), el libro estb dividido en probabilidad (Caps. 2-7) y metodos esta- 
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disticos (Caps. 8-15). En los capitulos 2 y 3 se presentan los conceptos basicos de 
probabilidad, variable aleatoria y distribucion de probabilidad. Los capitulos 4 y 5 
contienen una exposition bastante completa de las distribuciones de probabilidad 
discretas y continuas, asi como sus aplicaciones. En estos capitulos se investigan, 
comparan y contrastan propiedades de distribuciones como la binomial, de Poisson, 
normal, beta, gama y de Weibull, entre otras, proporcionando areas de aplicacion 
para cada una. Dado el creciente papel de las computadoras y las tecnicas de simula¬ 
tion, se dedica una section del capitulo 5 a la valoracion de varios metodos de gene¬ 
ration de valores aleatorios, en cada una de las distribuciones estudiadas. En el 
capitulo 6 se exponen las distribuciones de probabilidad conjunta y condicional. En 
este contexto, se introducen los conceptos de distribuciones a priori y a posteriori, 
para el punto de vista bayesiano. 

El capitulo siete funciona como transition entre la probabilidad y la inferencia 
estadistica. En este se plantean los importantes conceptos de muestra aleatoria y dis¬ 
tribucion de muestreo. En el capitulo 8 se presentan los metodos de estimacibn, 
tanto puntual como de intervalo. Tambien se estudian los limites de tolerancia inde- 
pendientes de la distribucion y aquellos cuyo fundamento es la distribucion normal. 
En el capitulo 9 se exploran las bases de la inferencia estadistica y se presentan 
las pruebas de hipotesis para medias, varianzas y proporciones. El capitulo 10 de- 
talla el uso de la distribucion chi-cuadrada, tanto para determinar la bondad del 
ajuste, como para tablas de contingencia, mientras que el capitulo 11 introduce al 
lector en los conceptos basicos del control de calidad estadistico y a los procedimien- 
tos para aceptar una muestra. En el capitulo 12 se presentan el diseno de experimentos 
estadisticos y el analisis de varianza, tanto para experimentos de un solo factor 
como para dos. En los capitulos 13 y 14 se trata, de manera prolija, el an&lisis de 
regresion; ademas, se examinan con detalle temas como: errores autocorrelaciona- 
dos, analisis de residuos, minimos cuadrados con factores de peso, multicolineali- 
dad y distintas formas para determinar el mejor conjunto de variables de prediction. 
Al concluir, el capitulo 15 explora y compara algunos de los procedimientos no 
parametricos mas utiles. 

Al final del capitulo 1 y del 13 se encuentra un apendice en que se revisa la no- 
tacibn sumatoria y del Algebra matricial. Las demostraeioncs de los teoremas mas 
importantes se encuentran, para los lectores cuyas inclinaciones son mas hacia la 
teoria, en los apendices de los capitulos 4, 5 y 7. En el apendice del libro se encuen¬ 
tran once tablas estadisticas. Se intentb, hasta donde fue posible, uniformar la 
estructura de estas; por ejemplo, se encuentran tabulados valores para las distri¬ 
buciones binomial, de Poisson, hipergeometrica y normal, ademas de los valo¬ 
res cuantiles para las distribuciones chi-cuadrada, t de Student y F. Las tablas para 
las distribuciones anteriores, excepto la hipergeometrica, se generaron mediante al- 
gunas subrutinas del paquete IMSL ( International Mathematical and Statistical Li¬ 
braries). La siimlitud con las tablas estadisticas, ya establecidas, es excelente. Los 
paquetes para computadora Minitab y SAS ( Statistical Analysis System) se emplea- 
ron con objeto de ilustrar las tbcnicas del an&lisis de regresion (Caps. 13 y 14). Se 
supone que el lector tiene acceso a algunos de estos paquetes o a otros similares, 
como el SPSS (Statistical Package for the Social Sciences) y BMDP (Biomedical 
Programs). 
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CAPITULO UNO 


Introduccion y 
estadistica descriptiva 



1.1 Introduccion 

Para mucha gente, estadistica significa descripciones numericas. Esto puede verifi- 
carse facilmente al escuchar, un domingo cualquiera, a un comentarista de television 
narrar un juego de futbol. Sin embargo, en terminos mas precisos, la estadistica es el 
estudio de los fenomenos aleatorios. En este sentido la ciencia de la estadistica tiene, 
virtualmente, un alcance ilimitado de aplicaciones en un espectro tan amplio de dis- 
ciplinas que van desde las ciencias y la ingenieria hasta las leyes y la medicina. El as- 
pecto mas importante de la estadistica es la obtencion de conclusiones basadas en los 
datos experimentales. Este proceso se conoce como inferencia estadistica. Si una 
conclusion dada pertenece a un indicador economico importante o a una posible 
concentration peligrosa de cierto contaminante, o bien, si se pretende establecer una 
relation entre la incidencia de cancer pulmonar y el fumar, es muy comun que la 
conclusion este basada en la inferencia estadistica. 

Para comprender la naturaleza de la inferencia estadistica, es necesario entender 
las nociones de poblacion y muestra. La poblacidn es la coleccion de toda la posible 
information que caracteriza a un fenomeno. En estadistica, poblacion es un concep- 
to mucho mas general del que tiene la aception comun de esta palabra. En este senti¬ 
do, una poblacion es cualquier colectidn ya sea de un numero finito de mediciones o 
una coleccion grande, virtualmente infinita, de datos acerca de algo de inter es. Por 
otro lado, la muestra es un subconjunto representativo seleccionado de una pobla¬ 
cion. La palabra representativo es la clave de esta idea. Una buena muestra es 
aquella que refleja las caracteristicas esentiales de la poblacidn de la cual se obtuvo. 
En estadistica, el objetivo de las tecnicas de muestreo es asegurar que cada observa- 
ti6n en la poblacion tiene una.oportunidad igual e independiente de ser incluida en 
la muestra. Tales procesos de muestreo eonducen a una muestra aieatoria. Las ob- 
servaciones de la muestra aieatoria se usan para calcular ciertas caracteristicas de la 
muestra denominadas estadisticas. Las estadisticas se usan como base para hacer in- 
ferencias acerca de ciertas j^^eristira&de la. poblacion, que reciben el nombre de 



2 Introduction y esladistica descriptiva 


parametros. Asi, muchas veces se analiza la information que contiene una muestra 
aleatoria con el proposito principal de hacer inferencias sobre la naturaleza de la 
poblacion de la cual se obtuvo la muestra. 

En estadlstica la inferencia es inductiva porque se proyecta de lo especifico 
(muestra) hacia lo general (poblacion). En un procedimiento de esta naturaleza 
siempre existe la posibilidad de error. Nunca podra tenerse el 100% de seguridad 
sobre una proposition que se base en la inferencia estadistica. Sin embargo, lo que 
hace que la estadistica sea una ciencia (separandola del arte de adivinar la fortuna) es 
que, unida a cualquier proposition, existe una medida de la confiabilidad de esta. 
En estadistica la confiabilidad se mide en terminos de probabilidad. En otras pa- 
labras, para cada inferencia estadistica se identifica la probabilidad de que la infe¬ 
rencia sea correcta. 

Los problemas estadisticos se caracterizan por los siguientes cuatro elementos: 

1. La poblacion de interes y el procedimiento cientifico que se empleo para mues- 

trear la poblacion. 

2. La muestra y el analisis matematico de su information. 

3. Las inferencias estadisticas que resulten del analisis de la muestra. 

4. La probabilidad de que las inferencias sean correctas. 

El enfoque precedente para la inferencia estadistica descansa unicamente en 
la evidencia muestral. Este es denominado teoria del muestreo o enfoque clasico de la 
inferencia estadistica y para la mayor parte de esta, sera el que se tome en este libro. 
Sin embargo, tambien se tratara de incorporar ocasionalmente otro punto de vista 
conocido como inferencia bayesiana. Esta forma de abordar la inferencia estadistica 
utiliza la combination de la evidencia muestral con otra information, generalmente 
proporcionada por el investigador del problema. Tal information descansa de ma- 
• nera fundamental en la conviction o grado de creencia del investigador con respecto 
a las iiicertidumbres del problema, antes de que se encuentre disponible la evidencia 
muestral. Este grado de creencia puede basarse en consideraciones como los resulta- 
dos conoddos, que son producto de investigaciones previas. Es importante que el 
lector comprenda que el objetivo de los procedimientos clasico y bayesiano descansa 
en la evaluation de las incertidumbres basadas en la probabilidad. 

Para comprender la esencia del muestreo aleatorio y de la inferencia estadistica, 
es necesario entender como primer punto, la naturaleza de una poblacion en el con- 
texto de la probabilidad y de los modelos probabilisticos. Estos temas se examinan 
con detalle en los capitulos dos a seis. 

Este capitulo tratara brevemente las estadisticas descriptivas. A pesar de que es- 
tas son sencillas desde el punto de vista matematico, son valiosas en casos donde se 
encuentra disponible la poblacion completa y no existe incertidumbre, o cuando 
se tienen a la mano grandes con juntos de datos que pueden o no considerarse como 
muestras aleatorias. Si un conjunto grande se considera como muestra aleatoria -de 
una poblacibn, la estadistica descriptiva puede ir tan lejos como la distribucibn gene¬ 
ral de valores, al dar una evidencia empirica y otras caracteristicas de la poblacibn. 
Esta evidencia tiene un apreciable valor puesto que afirma tiertas supositiones que 
deben formularse en la aplicacion de laJnferentia, estadistica. 
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1.2 Description grafica de los datos 

Una description informativa de cualquier conjunto de datos esta dada por la fre- 
cuencia de repetition u arreglo distributional de las observaciones en el conjunto. 
Para apreciar lo necesario de un resumen de datos, considere el ejemplo del Servicio 
de Hacienda Interno (SHI) que se encarga de recibir y procesar millones de declara¬ 
tions de ingresos durante todo el aflo. Es dudoso que el SHI pueda descubrir los 
patrones ocultos de ingresos e impuestos examinando simplemente la information 
contenida en las declarations. Similarmente, el Departamento del Censo no podria 
avanzar mucho al analizar los datos del censo, si estos no pudiesen visualizarse. Para 
identificar los patrones en un conjunto de datos es necesario agrupar las observa¬ 
ciones en un numero relativamente pequeflo de clases que no se superpongan entre si, 
de tal manera que no exista ninguna ambigiiedad con respecto a la clase a que perte- 
nece una observation en particular. El numero de observaciones en una clase recibe 
el nombre de frecuencia de clase, mientras que el cociente de una frecuencia de clase 
con respecto al numero combinado de observaciones en todas las clases se conoce 
como la frecuencia relativa de esa clase. Las fronteras de la clase se denominan 
limites, y el promedio aritmetico entre los llmites superior e inferior recibe el nombre 
de punto medio de la clase. Al graficarse las frecuencia relativas de las clases contra 
sus respectivos intervalos en forma de rectangulos, se produce lo que comunmente 
se conoce como histograma de frecuencia relativa o distribution de frecuencia relati¬ 
va. Esta ultima es la que puede hacer evidentes los patrones existentes en un conjun¬ 
to de datos. 

Como ilustracion, los datos de la tabla 1.1 representan las frecuencias de unidades 
vendidas por dia de un determinado producto por una compaflia. El histograma de 
frecuencia relativa se construye graficando en el eje vertical la frecuencia relativa y 
en ef eje horizontal las fronteras inferiores de cada clase, como se ilustra en la fi- 
gura 1.1. 

El numero de clases que se emplea para clasificar los datos en un conjunto de- 
pende del total de observaciones en este. Si el numero de observaciones es relativa¬ 
mente pequeflo, el numero de clases a emplear sera cercano a cinco, pero general- 


TABI.A 1.1 Frecuencias para el numero de unidades vendidas de cierto producto 


Numero de unidades 
vendidas (Clase) 

Frecuencia de 
la clase 

Frecuencia relativa 

80-89 

7 

7/100 = 0.07 

90-99 

20 

20/100 = 0.20 

100-109 

5 

5/100 = 0.05 

110-119 

11 

11/100 = 0.11 

120-129 

11 

11/100 = 0.11 

130-139 

12 

12/100 = 0.12 

140-149 

6 

6/100 = 0.06 

' 150-159 

23 

23/100 = 0.23 

160-169 

5 

5/100 = 0.05 

Total 

100 

1.00 
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Numero de unidades vendidas 


HGURA 1.1. Histograma de frecuencia relativa para el numero de unidades vendidas 


mente nunca menor que este valor. Si existe una cantidad sustancial de datos, el nu¬ 
mero de clases debe encontrarse entre ocho y doce y generalmente no existirhn mas 
de 15 clases. Un numero muy pequefio de clases puede ocultar la distribution real del 
conjunto de datos, mientras que un numero muy grande puede dejar sin observa- 
ciones a algunas de las clases, limitando de esta forma su uso. A manera de ilustra- 
don, si se reducen las nueve clases a solo tres, en el ejemplo anterior, como se indica 
en la tabla 1.2, el histograma de frecuencia relativa resultante (Fig. 2) es muy dife- 
rente al mostrado en la figura 1.1. 

Una buena practica es la creation de clases que tengan una longitud igual. Esto 
puede lograrse tomando la diferenda entre los dos valores extremos del conjunto de 
datos y dividiendola entre el numero de clases; el resultado ser& aproximadamente la 
longitud dd intervalo para cada clase. Sin embargo, existen casos donde esta regia 
no puede o no debe aplicarse. Por ejemplo, si se tuviera a la mano la lista de impues- 
tos de SHI pagados por la poblacion en un aflo, estas cantidades pueden encontrarse 


TABLA 1.2 Frecuencia para el numero de unidades vendidas de cierto producto 


Numero de unidades 
vendidas (dose) 

Frecuencia de 
la clase 

Frecuencia relativa 

80-109 

32 

32/100 = 0.32 

110-139 

34 

34/100 = 0.34 

140-169 

34 

34/100 = 0.34 

Total 
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F1GURA 1.2 Histograma modificado para el numero de uni dad es vendidas 

en un intervalo de $0 a $1 000 000. Aun a pesar de que se eligiesen 20 clases para la 
distribucion de frecuencia relativa, con intervalos de igual longitud, cada clase 
tendria una cobertura de $50 000. Lo anterior daria origen a una situacion en la que 
casi todas las observaciones caerian en la primera clase. Para casos como este es pre- 
ferible seleccionar una escala mas pequerla en el extremo inicial que la utilizada para 
el extremo superior. Esta election aclarara el patron de la distribucion. 

Los siguientes ejemplos ilustran estos conceptos. 


Ejemplo 1.1 De acuerdo con la revista Informes al Consumidor en su numero de 
febrero de 1980, las cuotas anuales de 40 compaflias para un seguro de $25 000 para 
hombre de 35 aflos de edad son las siguientes: 


$ 82 

85 

86 

87 

87 

89 

89 

90 

91 

91 

92 

93 

94 

95 

95 

95 

95 

95 

97 

98 

99 

99 

100 

100 

101 

101 

103 

103 

103 

104 

105 

105 

106 

107 

107 

107 

109 

110 

110 

111 


Establecer un esquema de agrupamiento para este conjunto de datos y determinar 
las frecuencias relativas. 

Dado que la diferencia entre los dos valores extremos del conjunto es de solo 
$29, puede ser razonable agrupar los datos en clases con intervalos de igual longitud. 
Supongase que se decide utilizar seis clases; entonces el intervalo de cada clase ser4 
aproximadamente de $5. Para establecer las fronteras de cada clase, es necesario 
considerar la unidad mas cercana con respecto a la cual se miden las observaciones. 
En este ejemplo las cuotas se presentan redondeadas al dolar mas cercano. Con toda 
seguridad el importe de las pero solo se presentan 

l/\r ra/1 rtn/lon/l/M' D/\f lo ft > o /lo t OO no i n + o aatma lo ma/laU 


entre $81.50 y $82.49, las seis clases con sus respectivas fronteras son (81.5-86.5), 
(86.5-91.5), (91.5-95.5), (96.5-101.5), (101.5-106.5) y (106.5-111.5). 

Estas fronteras tambien se conocen como los limites verdaderos debido a que 
reflejan la unidad mas pequefla que se emplea para tomar las observaciones. Dado 
que las cuotas se presentan redondeadas al dolar mas cercano, se puede tambien 
elegir los limites de las seis clases como (82-86), (87-91), (92-96), (97-101), (102-106) 
y (107-111). Estos se conocen como los limites de escritura puesto que reflejan el 
mismo grado de precision que el de las observaciones presentadas. El intervalo de la 
clase es la diferencia entre los limites verdaderos de cada clase, mientras que los pun- 
tos medios pueden determinarse al utilizar los limites verdaderos o los de escritura. 
En la tabla 1.3 se da un resumen de la information pertinente para el agrupamiento 
de este ejemplo. 

De acuerdo con lo mencionado al principio de esta section, la distribution de fre- 
cuencia relativa se determina graficando las frecuencias relativas en el eje vertical 
contra los limites de escritura inferiores para cada una de las clases en el eje horizon¬ 
tal. Para este fin se emplean rectangulos de igual anchura que representen las fre¬ 
cuencias relativas. En la figura 1.3 se muestra el histograma del ejemplo 1.1. Notese 
que es mas facil graficar las frecuencias de cada clase que las correspondientes fre¬ 
cuencias relativas; en ambos casos las graficas seran identicas. Si existe alguna prefe- 
rencia para usar las frecuencias relativas, se debe a que la escala vertical tiene un in¬ 
tervalo fijo de cero a uno. 

El principal objetivo de la representation graflca de las frecuencias relativas es 
mostrar el perfil de distribution de los datos. El conocimiento de este perfil es util en 
varias formas, como sugerian los analisis apropiados que se intentaran mediante la 
inferencia estadistica, o si los datos constituyen una muestra aleatoria de alguna 
poblacion o si se utilizan con el fin de comparar los perfiles de distribution de dos o 
mas conjuntos de datos. En el ejemplo 1.1. es notorio que la distribution de cuotas 
anuales en las 40 compaflias es uniforme a traves de todo el intervalo de valores. 

Otra caracterizacion grafica util, de un conjunto de datos, es la distribution de 
frecuentia relativa acumulada u ojiva. La distribution acumulativa se obtiene grafi- 
cando, en el eje vertical, la frecuentia relativa acumulativa de una clase contra el 


TABLA 1.3 Agrupamiento y frecuencias relativas para el ejemplo 1.1 


Limites de escritura 
de la clase 

Punto 

medio 

Frecuentia de la clase 

f 

Frecuentia relativa 

fi/n 

82-86 

84 


3 

3/40 = 0.075 

87-91 

89 


7 

7/40 = 0.175 

. 92-96 

94 


8 

8/40 = 0.200 

97-101 

99 

\ 

8 

8/40 = 0.200 

102-106 

104 

\ 

7 

7/40 = 0.175 

107-111 

109 


7 

7/40 = 0.175 


Total 


40* 

1.000 
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FIGURA 1.3 Distribucion de frecuencia relativa para los datos del ejemplo 1.1 


limite inferior de la siguiente sobre el eje horizontal y uniendo con segmentos todos 
los puntos consecutivos. La tabla 1.4 lista las frecuencias relativas acumuladas para 
el ejemplo 1.1. 

Dado que la frecuencia relativa de una clase refleja la proportion de las observa- 
ciones contenidas en esta, la frecuencia relativa acumulativa es la proporcion de ob- 
servaciones cuyos valores son menores o iguales al limite superior de la clase o, en 
forma equivalente, menores que el limite inferior de la siguiente clase. En el ejemplo 
1.1 y para la tabla 1.4, la proporcion de cuotas menores de $82 es cero. La de cuotas 
menores de $87 es de 0.075, la proporcion de menores de $92 es de 0.250. La distri¬ 
bucion de frecuencia relativa acumulativa para el ejemplo 1.1 se muestra en la figu- 
ra 1.4. 

En este contexto el principal uso de la distribucion acumulativa es lo que comun- 
mente se conoce como cuantiles. Con i especto a una distribucion de frecuencia rela¬ 
tiva acumulativa, se define un cuantil como el valor bajo el cual se encuentra una de- 
terminada proporcion de los valores de la distribucion. El valor del cuantil se lee en 


TABLA 1.4 Distribucion de la frecuencia relativa acumulativa 


Limites de 


escritura de 
la clase 

Frecuencia 
de clase 

Frecuencia 

acumulativa 

Frecuencia relativa 
acumulativa 

82-86 

3 

3 

3/40 = 0.075 

87-91 

7 

- 10 

10/40 = 0.250 

92-% 

• 8 

18 

18/40 = 0.450 

97-101 

8 

26 

26/40 = 0.650 

102-106 

> 7 

33 

33/40 = 0.825 

107-111 

7 

40 

40/40 = 1.000 
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FIGURA 1.4 Distribution de frecuencia relativa acumulativa para el ejemplo 1.1 


'i 



la direction opuesta, en el eje horizontal, a la proportion correspondiente deseada 
sobre el eje vertical. El cuantii mas comun es el percentil. Por ejemplo, q 02 es el 
valor bajo el cual se encuentra el 20% de los valores de la distribution y q 09 e s aquel 
bajo el cual se encuentra el 90% de los valores de la distribution. 

Ejemplo 1.2 El departamento de Agricultura de Estados Unidos informo que, en 
1976, los ingresos netos por cosecha para los 50 estados de la nacidn, fueron los si- 
guientes: 


$ 5 952 

63 855 

39 362 

9 692 ' 

27 611 

13 647 

10 630 

6 644 

4 438 

19 106 

8 681 

5 332 

2 304 

6 859 

8 141 

11 771 

9 378 

5 992 

7 000 

12 543 

4 963 

4 543 

11 177 

12 292 

6 695 

10 207 

7 627 

8 992 

23 811 

7 657 

8 043 

8 972 

6 480 

6 824 

9 554 

4 626 

4 845 

10 452 

9 922 

7 683 v 

5 119 

8 621 

2 290 

4 973 

3904 

2 892 

5 405 

2 789 

30 

241 


Establecer un esquema de agrupamiento para este conjunto de datos y determinar 
las frecuencias relativas. 
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TABLA 1.5 Frecuencias relativas para el ejemplo 1.2 con intervalos de igual longitud 


Limites de escritura de la close 

Frecuencia de la clase 

Frecuencia relativa 

0-7 999 

27 

0.54 

8 000-15 999 

18 

0.36 

16 000-23 999 

2 

0.04 

24 000-31 999 

1 

0.02 

32 000-39 999 

1 

0.02 

40 000-47 999 

0 

0 

48 000-55 999 

0 

0 

56 000-63 999 

1 

0.02 

Total 

50 

1.00 


Supongase que se decide emplear ocho clases de igual longitud. Puesto que la di- 
ferencia entre los dos valores extremos del conjunto de datos es aproximadamente 
de $64 000, la longitud de cada clase es de $8 000 y los limites son (-0.5-7 999.5), 
(7 999.5-15 999.5).(55 999.5-63 999.5). Las frecuencias de cada clase y las fre¬ 

cuencias relativas para este esquema de agrupamiento se dan en la tabla 1.5. Tal es- 
quema resulta inadecuado porque el 90% de las observaciones se encuentran en las 
dos primeras clases y existen otras dos que no tienen ninguna observation. Este 
ejemplo ilustra un conjunto de datos para el que no deben usarse intervalos de igual 
longitud, ya que se tiene un agregado muy alto de observaciones con solo algunas 
cuantas dispersas alrededor de este. En el ejemplo 1.2 existe mayor concentration de 
datos en el extremo inferior que en el superior. Por consiguiente, considerese el si- 
guiente esquema de agrupamiento de ocho clases con limites (-0.5-1 999.5), 
(1 999.5-3 999.5), (3 999.5-5 999.5), (5 999.5-7 999.5), (7 999.5-11 999.5), 
(11 999.5-27 999.5), (27 999.5-43 999.5), (43 999.5-75 999.5). La tabla 1.6 contiene 
las frecuencias relativas para este esquema, mientras que en la figura 1.5 se muestra 
la distribucion de frecuencias. 

A1 determinar la distribucion de frecuencia relativa de la figura 1.5, se empleo la 
altura del rectangulo en la representation de la frecuencia relativa de cada clase, de 
la misma manera como se hizo en el ejemplo 1.1. Sin embargo, a causa de que los 
intervalos no tienen la misma longitud, la figura 1.5 produce la impresion erronea de 
que, por ejemplo, la clase (12 000-27 999) contiene mas del 12% de las observa¬ 
ciones. Lo anterior se debe a que cuando se comparan figuras geometricas, como los 
rectangulos, se tiende mas a comparar el area que la altura. Cuando los intervalos de 
clase son identicos, el area de los rectangulos representa las frecuencias. Sin embargo 
cuando la longitud de los intervalos es diferente, como en el ejemplo 1.2, las areas 
no representan la frecuencia. Por lo tanto, es necesario ajustar la altura de los rec¬ 
tangulos para que sus areas sean proporcionales a la frecuencia. Este procedimiento 
representa de manera correcta las frecuencias para intervalos de diferente longitud. 

Para ilustrar este metodo, en el ejemplo 1.2, se observa que las longitudes de las 
primeras cuatro clases son identicas. Entonces deben ajustarse las ultimas cuatro con el 
fin de que sus longitudes se relacionen con las de las primeras cuatro clases (de 
$2 000). Las alturas de los rectangulos correspondientes a las cuatro ultimas clases se 
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FIGURA 1.5 Distribution de frecuencia relativa para los ingresos por cosecha del afio 1976 


ajustan de tal forma que su area se encuentra en la misma proportion (2 000) con res- 
pecto a sus frecuendas relativas que las de los rectangulos de las primeras cuatro cla- 
ses. Las alturas de las primeras cuatro siguen siendo las mismas que aparecen en la ul¬ 
tima columna de la tabla 1.6, mientras que las alturas corregidas para las ultimas 
cuatro son 0.15, 0.015, 0.0025 y 0.00125 respectivamente. En este momento debe 
notarse que la suma de todas estas nuevas alturas es de 0.70875 y no de 1.00, como es 
requerido para frecuencias relativas. Una division por 0.70875 convertira estas altu¬ 
ras a las frecuencias relativas deseadas. En la tabla 1.7 aparecen las frecuendas rela¬ 
tivas corregidas y en la figura 1.6 se da la ccrrecta representation de la distribution 
de frecuenda relativa. 


TABLA 1.6 Frecuencias relativas para el ejemplo 1.2 con intervalos de distinta longitud 


Limites de eseritura de la close 

Frecuencia de la close 

Frecuencia relativa 

0-1 999 


2 

0.04 

2 000-3 999 


5 

0.10 

4 000-5 999 


11 

0.22 

6 000-7 999 

\ 

9 

0.18 

8 000-11 999 

15 

0.30 

12 000-27 999 


6 

0.12 

28 000-43 999 >• 


1 

1 0.02 

> ? v 44 000-75 999 


1 

0.02 

J Total ' 


50 

1.00 
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TABLA 1.7 Frecuencias relativas corregidas para el ejemplo 1.2 con intervalos de distinta 
longitud 


Limites de escritura de la close 

Frecuencia relativa corregida 

0-1 999 

0.0564 

2,000-3 999 

0.1411 

4,000-5 999 

0.3104 

6,000-7 999 

0.2540 

8,000-11 999 

0.2116 

12,000-27 999 

0.0212 

28,000-43 999 

0.0035 

44,000-75 999 

0.0018 

Total 

1.0000 


1.3 Medidas numencas descriptivas 

En la seccion anterior se plantearon las tecnicas graflcas para descubrir los patrones 
de distribucion ocultos en un conjunto de datos. En esta seccion se definen algunas 
medidas numericas que se emplean comunmente para describir conjuntos de datos. 
Si el conjunto es una muestra aleatoria de una poblacion y la ultima meta es hacer 
inferencia estadistica, estas medidas seran utilizadas como bases para las inferen- 
cias, tal como se menciona en los capitulos 7 a 9. 



Ingresos net os por cosecha (miles de dolares) ■ 


F1GURA 1.6 Distribucion de frecuencia relativa corregida para los ingresos por cosecha del 
afio 1976 ■ ; . ... " 
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Existen dos medidas de interes para cualquier conjunto de datos: la localization 
de su centro y su variabilidad. La tendencia central de un conjunto de datos es la dis¬ 
position de estos para agruparse ya sea alrededor del centro o de ciertos valores nu- 
mericos. La variabilidad de un conjunto de datos es la dispersion de las observa¬ 
tions en el conjunto. 

Existen principalmente tres medidas de tendencia central: la media, la mediana y 
la moda. 

Definition 1.1 La media de las observaciones jc, , x 2 , x n es el promedio arit- 
metico de estas y se denota por 


n 

x='2jX i /n. ( 1 . 1 ) 

1 = 1 

La media es una medida apropiada de tendencia central para muchos conjuntos 
de datos. Sin embargo, dado que cualquier observation en el conjunto se emplea 
para su calculo, el valor de la media puede afectarse de manera desproporcionada 
por la existencia de algunos valores extremos. 

Definition 1.2. La mediana de un conjunto de observaciones es el valor para el 
cual, cuando todas las observaciones se ordenan de manera creciente, la mitad de es¬ 
tas es menor que este valor y la otra mitad mayor. 

Si el numero de observaciones en el conjunto es impar, la mediana es el valor de 
la observation que se encuentra a la mitad del conjunto ordenado. Si el numero es 
par se considera la mediana como el promedio aritmetico de los valores de las dos 
observaciones que se encuentren a la mitad del conjunto ordenado. Alternativamen- 
te, la mediana puede determinarse a partir de la distribution acumulativa, es decir, 
la mediana es el percentil cincuenta. 

Puesto que la mediana es un valor que se basa en la secuencia ordenada de las ob¬ 
servaciones en un conjunto de datos, es necesario saber que la existencia de algunos 
valores extremos no afectara su valor. Por lo tanto, si un conjunto contiene unos 
cuantos valores extremos y un agregado muy alto de observaciones, la mediana 
puede ser una medida de tendencia central mucho mas deseable que la media. Gene- 
ralmente los conjuntos de datos que describen information acerca de ingresos caen 
en esta categoria. 

Definition 1.3 La moda de un conjunto de observaciones es el valor de la observa¬ 
tion que ocurre con mayor frecuencia en el conjunto. 

La moda muestra hacia que valor tienden los datos a agruparse. En conjuntos re- 
lativamente pequeflos, puede que no exista un par de observaciones cuyo valor sea el 
mismo. En esta situation no es tiara la definition de moda. Tambien puede suceder 
que la frecuencia mas alta se encuentre compartida por dos o mas observaciones. En 
estos casos, la moda tiene una utilidad limitada como medida de tendencia central. 
Si se ha determinado una distribution de frecuencia relativa, la clase con la frecuen- 
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cia mas alta recibiri el nombre de clase modal, con lo que se define a la moda como 
el punto medio de esa clase. En este caso la clase modal sirve como punto de con¬ 
centration en el conjunto de datos. 

Para las observaciones del ejemplo 1.1 la media se calcula como 


,v 


82 + 85 + ••■ + 111 
40 


= $97.90. 


La media para el ejemplo 1.2 es 


x = 


5,952 4 - 63,855 + ••• + 241 
50 


$9 811 . 34 . 


La mediana del ejemplo 1.1 es el promedio artimetico de los valores de las obser¬ 
vaciones 20 y 21 en la secuencia ordenada de estas, ya que existe un numero par de 
observaciones. La mediana es (98 + 99)/2 = $98.50. Similarmente, la mediana del 
ejemplo 1.2 es el promedio aritmetico de los valores de las observaciones 25 y 26 en 
la secuencia ordenada de estas, o (7 627 + 7 657)/2 = $7 642. Se observa que la moda 
en el ejempo 1.1 es $95 porque este valor es el que ocurre con mayor frecuencia; sin 
embargo, para el ejemplo 1.2 la moda no esta claramente definida puesto que nin- 
gun valor se repite. Notese que para el ejemplo 1.1 los valores de la media, mediana y 
moda se encuentran muy cercanos, relativamente, entre si. Esto se debe a que las 
cuotas se encuentran distribuidas de manera uniforme sobre el intervalo completo de 
valores. Para el ejemplo 1.2 la media es sustancialmente mayor que la mediana, de- 
bido a que la primera se encuentra afectada de manera desproporcionada por los 
ingresos por cosecha de algunos estados, los que son muy grandes comparados con 
los de otros. Asi, para este conjunto de datos la mediana de $7 642 podria ser una 
medida de tendencia central mucho mas real. 

Muchas veces la unica information disponible es una tabla de frecuencias, como 
las tablas 1.3 a 1.6. En estos casos solo es posible obtener valores aproximados para 
la media, mediana y moda — o para cualquier otra medida numerica descriptiva —; 
los valores exactos pueden calcularse unicamente a partir de las observaciones indi¬ 
viduates del conjunto o de los datos no agrupados. Los calculos aproximados se 
basan en los puntos medios de cada clase y sus respectivas frecuencias. En general, 
mientras mis pequefia sea la longitud de la clase y mayor la uniformidad de las ob¬ 
servaciones en esta, mayor sera la similitud entre las medidas descriptivas calculadas 
en los datos agrupados y no agrupados. 

Para calcular la media con base en los datos agrupados, sea k el numero de clases 
y X; el punto medio de la r-esima clase. Entonces el valor aproximado de la media es 

i-.i . * = 'ZfiXi/n, (1.2) 

no:.,- , •: . = . 1=1 . 

en 'donde /- es la frecuencia de la f-faiima clase y n = Sf.,, f . N6tese que en esta 
fbrmula la frecuencia de la clase representa la frecuencia relativa de las observaciones 
dentro de cada clase. Es decir, entre mis observaciones tenga una clase mayor seri el 
peso del punto medio de esta en el calculo de la media. La afirmacidn anterior gene- 
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'ABLA 1.8 Calculo aproximado de la media para el ejemplo 1.1 


Punto medio 
de la clase 

X, 

Frecuencia de 
la clase 

f 

fx, 

84 

3 

252 

89 

7 

623 

94 

8 

752 

99 

8 

792 

104 

7 

728 

109 

7 

763 

Total 

40 

3 910 


« = 2 f = 40 

i = I 

6 

2fx, = 3 910 

b 

x = 'Zfx./n = 3 910/40 = $97.75 

»= I 


ralmente es cierta en la determination de medidas numericas con base en datos agru- 
pados. 

Se ilustraran los procedimientos computacionales para determinar las medidas 
descriptivas numericas empleando el ejemplo 1.1 y en particular los limites y frecuen- 
cias de cada clase expuestos en la tabla 1.3. La information mas importante aunada 
al calculo de la media se muestra en la tabla 1.8. 

Para datos agrupados, la mediana es aquel valor que divide en dos partes iguales 
la distribucibn de frecuencia relativa. La formula computacional esta dada por 

Mediana = L + c{j/f„), (1.3) 

en donde L es el limite inferior de la clase donde se encuentra la mediana, f m es la 
frecuencia de esa clase, c es la longitud de la clase y j es el numero de observaciones 
en esta clase, necesarias para completar un total de n/2. Para determinar la mediana 
esta formula en esencia, se interpola linealmente en la clase que contiene a la media¬ 
na. Asi, se supone que las observaciones se encuentran distribuidas uniformemente 
dentro de la clase. 

La mediana para los datos agrupados del ejemplo 1.1 se determina utilizando la 
informatibn contenida en la tabla 1.3. El numero total de observaciones es 40 y n/2 
es 20. Hues to que la suma de las frecuencias de las primer as tres clases es 18 y la de 
las primeras cuatro es 26, la mediana se encuentra en la cuarta clase, cuyo limite in¬ 
ferior es 97. Del total de observaciones en esta clase, que es ocho, se necesitan dos 
m&s para alcanzar el valor de 20. Mediante el empleo de la formula, la mediana re- 
sulta ser 

Mediana = 97 + 5(2/8) = $98.25. 

Como se menciono anteriormente, la moda se toma, para datos agrupados, como 
el punto medio de la clase que presenta una mayor frecuencia. En el ejemplo 1.1 la 
frecuencia m&s alta se encuentra compartida por las clases (92-96) y (97-101). Con 
base en lo anterior, la moda resulta ser el promedio aritmetico entre los dos puntos 
medios delas clases, o (94 + 92)/2 = J96.50./;L; J( , V,. 

. Una medida de tendencia central proporciona informacibn acerca de un conjun- 
to de datos pero no proporciona ninguna idea de la variabilidad de las observaciones 
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en dicho conjunto. Por ejemplo, considere los dos siguientes conjuntos de datos, 
cada uno de los cuales consiste de cuatro observaciones: 0, 25, 75, 100; 48, 49, 51, 
52. En ambos casos, media = mediana = 50. Estos dos conjuntos son muy diferen- 
tes entre si, sin embargo las observaciones en el primero se encuentran mucho mas 
dispersas que las del segundo. Una de las medidas mas utiles de dispersion o va¬ 
riation es la varianza. 

Definition 1.4 La varianza de las observaciones x ,, x 2 , es, en esentia, el pro- 

medio del cuadrado de las distancias entre cada observation y la media del conjunto 
de observaciones. La varian 2 a se denota por 

n 

s 2 =£(*/-*)7(n - 1). (1.4) 

i=i 

La varianza es una medida razonablemente buena de la variabilidad debido a que 
si muchas de las diferencias son grandes (o pequefias) entonces el valor de la varian¬ 
za s 2 sera grande (o pequefio). El valor de la varianza puede sufrir un cambio muy 
desproporcionado, aun mas que la media, por la existentia de algunos valores extre¬ 
mes en el conjunto. 

Definition 1.5 La raiz cuadrada positiva de la varianza recibe el nombre de des¬ 
viacion estandar y se denota por 


s = J £(*, - x) 2 /(n - 1). 


(1.5) 


La varianza y la desviacion estandar no son medidas de variabilidad distintas, 
debido a que la ultima no puede determinarse a menos que se conozca la primera. 
A menudo se prefiere la desviacion estandar en relation con la varianza, porque se 
expresa en las mismas unidades fisicas de las observaciones. 

Cuando se calcula el valor de la varianza, ya sea a mano o mediante el uso de una 
calculadora de baja caparidad, y el valor de la media o los valores de las observa¬ 
ciones no son numeros enteros, el uso de la ecuacion (1.4) puede dar origen a errores 
grandes por redondeo. Con un poco de Algebra se obtiene, a partir de (1.4), una formu¬ 
la computational m&s exacta para esas condiciones:* 

n 

s 1 = 2 (*/ - x) 2 /{n - 1 ) 

I“1 

2(*/ -2 XX, + x 2 ) 

n - 1 ■ ■ ■.-!*£ 

* Para un repaso de la notaci6n de suma viase d apdidice de este capitulo. •' 
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2 


2 


Xi 


2x X + nx 1 
n - 1 

2 (S x, j n^XiJ 


n - I 



( 1 . 6 ) 


Notese que para el numerador de la ecuacion (1.4) primero debe calcularse la media, 
restarla de cada observation, tomar el cuadrado y entonces sumar. Para el numera¬ 
dor de (1.6) se suman todos los cuadrados de los valores observados, y entonces se res- 
ta el cuadrado de su suma dividido por el numero de observaciones. Con base en la 
ecuacion (1.6), la desviacion estandar esta dada por 



(1.7) 


A continuation se ilustran los pasos que se deben seguir para el calculo de la va- 
rianza y la desviacion estlndar, para los datos no agrupados de los ejemplos 1.1 y 
1 2. Para el ejemplo 1.1, 

40 

X x, = 82 + 85 + ••• + 111 = 3 916 

1 = I 

40 

2 x- = 82 2 + 85 2 + - + III 2 = 385 756. 

1=1 


Se usa la ecuad6n (1.6), 


\ 


385 756 - 


(3 916) 2 
40 - ‘ 


40 - 1 


61.0154. 


De la ecuacidn (1.7) se sigue que la desviacidn estdndar es s = V61.0154 = 
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Para el ejemplo 1.2 se tiene 

50 

2 X. = 5 952 + 63 855 + ••• + 241 = 490 567, 

i= I 
50 

2 x 2 = 5 952 2 + 63 855 2 + ••• + 241 2 = 10 000 514 273, 

i=i 


y 


10 000 514 273 - 


5 2 = 


490 567 2 
50 


50 - 1 


105 865 196.8. 


La desviacion estandar es s = $10 289.08. 

Para datos agrupados, puede calcularse el valor aproximado de la varianza me- 
diante el uso de la formula 


'Z/tei ~ x) 2 


s 7 = i=l 


n - 1 


o 


s 


2 




n 


n - 1 


(1.8) 


(1-9) 


La formula para la desviacion estandar es 


5 = hfVc, - x) 2 /(n - 1). (L10) 

Para las tres formulas anteriores f y x, son, respectivamente, la frecuencia y el 
punto medio de la /-esima clase, y n es la suma de todas las frecuencias. Debe notarse 
que, en datos agrupados, la aproximacion a la varianza puede no ser muy confiable, 
especialmente si las observaciones no se encuentran distribuidas de manera uniforme 
dentro de sus respectivas clases. El calculo de los valor es aproximados de la varianza 
y la desviaci&n est&ndar, para los datos agrupados del ejemplo LL-se encuentra de- 
tallado en la tabla 1.9. -,h urh? r ; r ;r ->r . •: r - 

Otra medida util de la variabilidad tiene base en el valor absoluto de las diferen- 
cias entre las observaciones x ,, x 2 „. x n y |a media o la mediana, dependiendo de cual 
de las dos se emplee com ITI 
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TABLA 1.9 Calculo de los valores aproximados de la varianza y la desviacion estandar para 
elejemplol.l ■ 


Punto medio 
de la close 

Xi 

Frecuencia de 
la close 

f x ‘ 

fx] 

6 

2 fxi 

i= i 

= 3 910 (de la tabla) 1.8) 

84 

3 

7 056 

21 168 

(l fixX/AO 

= 382 202.5 

89 

7 

7 921 

55 447 

\i= 1 / / 


94 

8 

8 836 

70 688 

6 


99 

104 

8 

7 

9 801 

10 816 

78 408 

75 712 

2/k 

i= 1 

= 384 590 

109 

7 

11 881 

83 167 

c 2 

384 590 - 382 202.5 

Total 

40 

11 881 

384 590 

S 

40 - 1 






= 61.2179 





s 

= V6L2179 = $7.82 


Definition 1.6 La desviacion media es el promedio de los valores absolutos de las 
diferencias entre cada observation y la media de las observaciones. La desviacion 
media esta dada por 

2 k -*1 

D.M. = —-. (1.11) 

n 

Para datos agrupados, el valor de la desviacion media se aproxima por 

k 

2/k - *1 

D.M. = ——j-. (1.12) 

2 / 

i= I 

Los terminos empleados en estas expresiones son los mismos definidos anterior- 
mente. 

La desviacion media es una medida interesante de la variation, especialmente en el 
contexto de la evidencia empirica, debido a que en muchas ocasiones el interes se 
centra en las desviaciones y no en los signos de estas. Sin embargo, desde un punto de 
vista te6rico, el empleo de la desviacibn media como medida de dispersibn esti en 
desventaja dado que, matem&ticamente, es dificil de obtener. De cualquier manera, 
la desviacibn media es menos sensible a los efectos inducidos por las observaciones 
extremas del conjunto de datos que la varianza o la desviacibn estindar.' Sin irtipbr- 
tar la presencia de pocos valores extremos, la desviacibn media puedeproprircio- 
nar una medida de dispersion mucho mils real que la obtenida por la desviacibn es- 
tandar. ••• • • ■ ■ - 


www. FreeLibros. com 


1.3 Medidas descriplivas numericas 19 


Para los datos no agrupados del ejemplo 1.1, la desviacion media se calcula a 
partir de 

40 

2k - *1 = (82 - 97.9| + 185 - 97.9| + + 111 - 97.9| = 264,2 

/= i 

para ser 

DM. = 264.2/40 = $6.61. 

De manera similar para el ejemplo 1.2, la desviacion media se calcula a partir de 


50 

2k - x\ = |5 952 - 9 811.34| + |63 855 - 9 811.34| + ••• + |241 - 9 8U.34| 

i=i 

= 278 051.48 

para ser 

DM. = 278 051.48/50 = $5 561.03. 

Los pasos computacionales para una aproximacion de la desviacion media a los 
datos agrupados del ejemplo 1.1, se ilustran en la tabla 1.10. 

Definition 1.7 La desviacion mediana es el promedio de los valores absolutos de 
las diferencias entre cada observation y la mediana de estas. La desviacion mediana 
esta dada por 

1 

2 k - DMd\ 

DMd. = —-, (1.13) 

n 

en donde Md denota a la mediana. 

Cuando la mediana se emplea como medida de tendencia central con el proposito 
de atenuar los efectos de la existencia de algunos valores extremos en el conjunto, 


TABLA 1.10 Calculo aproximado de la desviacion de la mediana para el ejemplo 1.1 


Punto medio Frecuencia de 


de la close 

x, 

la close 
f 

k - 

-7f| 

f\X; ~ X\ 


84 

3 

! 84 - 

97.75) 

41.25 

6 

89 

7 

I 89 - 

97.75| 

61.25 - 

2 Mx, - x\ = 265 

94 

8 

| 94 - 

97.75| 

30.00 

1=1 

99 

8 

! 99 - 

97.75| 

10.00 

DM. = 265/40 

'*104 

7 

‘ ’ j104 - 

97.75| 

43.75 


109 

7 

(109 - 

97.75| 

78.75 

•== $6.63 ' 

Total 

40 „ 



265.00 
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debe preferirse a la desviacion de la mediana como medida de dispersion por la misma 
razon. Cuando los datos se agrupan, se obtiene el valor aproximado de la desviacion 
de la mediana al emplear la ecuacion (1.12) y sustituir la mediana por la media. Las 
desviaciones de las medianas para las observaciones de los ejemplos 1.1 y 1.2 calcu- 
ladas con el mismo procedimiento que para las desviaciones de las medias, son 6.6 y 
5 060.60 respectivamente. De manera similar el valor aproximado de la desviacion 
de la mediana para los datos agrupados del ejemplo 1.1 tiene un valor de 6.575. 

El intervalo en el que se encuentran las observaciones en un conjunto de datos, es 
otra medida de variabilidad. 

Definition 1.8 El recorrido R de las observaciones en un conjunto de datos es la di- 
ferencia entre el valor mas grande y el mas pequefto del conjunto. 

Por su simplicidad, el recorrido proporciona una rapida indication de la variabi¬ 
lidad existente entre las observaciones de un conjunto de datos. Sin embargo, como 
medida de dispersion debe usarse con precaution ya que su valor es una funtion, 
unicamente, de dos valores extremos pertenecientes al conjunto. Como regia general 
se debe evitar el uso del recorrido como medida de variabilidad, cuando el numero 
de observaciones en un conjunto es grande o cuando este contenga algunas observa¬ 
ciones cuyo valor sea relativamente grande. Este punto puede ilustrarse consideran- 
do los recorridos de los ejemplos 1.1 y 1.2, que son /?, = 111 - 82 = $29, y R 2 = 
63 855 - 30 = $63 825, respectivamente. Para el ejemplo 1.1, /?, parece ser una 
medida realista de la variabilidad, debido printipalmente a que el conjunto no con- 
tiene ninguna cuota que se saiga de la linea relativa a las otras. Sin embargo, para el 
ejemplo 1.2, R 2 no es una medida realista de la variabilidad, dado que los valores de 
$30 y $63 855 son, aparentemente, valores extremos con respecto a los ingresos ne- 
tos por cosecha de gran parte de los otros estados. Para muchos problemas tiene una 
mayor utilidad determinar el recorrido entre dos valores cuantiles que entre dos va¬ 
lores extremos. 

Definition 1.9 La diferentia entre los percentiles 75avo y 25avo recibe ei nombre 
de recorrido intercuantil. 

Definition 1.10 La diferentia entre los percentiles 90avo y decimo recibe el nombre 
de recorrido interdecil. 

El recorrido intercuantil refleja la variabilidad de las observaciones comprendi- 
das entre los percentiles 25 y 75 en el conjunto de datos, y el recorrido interdecil indi- 
ca la dispersidn de las observaciones con valores entre los percentiles 90 y 10. El re- 
sultado es que ni el rango intercuantil ni el interdecil son afectados por la presencia 
de observaciones relativamente grandes. v 

Para datos agrupados se pueden aproximar los recorridos intercuantil e interde- 
&1 a pairtir de la distribution r de frecuencia relativa acumulada. Para ilustrar, 
empleando la figura 1.1, los valores aproximados de los rangos intercuantil e inter¬ 
decil para el ejemplo 1.1 son q 0 ,?5 - do .25 = 104.50 -92 = $12.50, yq 0 . 9 ~ do.i = 
109.5 — 87.5 = $22, respectivamente. Para un conjunto de datos no agrupados 
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que contenga n observaciones, los percentiles 75avo y 25avo son los valores de las 
observaciones cuyos numeros de posicion en la secuencia ordenada de observa¬ 
ciones, corresponden a 0.75 n + 0.5 y 0.25 n + 0.5, respectivamente. De manera si¬ 
milar, los percentiles 90 y decimo corresponden a los valores de las observaciones cu¬ 
yos numeros de posicion, con respecto a la secuencia ordenada, son 0.9/i + 0.5 y 
O.l/i + 0.5 respectivamente. Para los datos del ejemplo 1.2, los percentiles 25 y 75 son 
los valores de las observaciones 13 y 38 correspondientes a la secuencia ordenada de las 
observaciones, respectivamente. De esta manera, q 0 ,2 s = $4 973, q„ lf = $10 207, 
siendo el recorrido intercuantil de $5 234. Dado que para n = 50 0.1 n + 0.5 = 
5.5, el decimo percentil es el promedio de los valores 5 y 6, de las observaciones 
ordenadas, o q a .\ = 2 840.5. Similarmente el percentil 90avo es el promedio de las 
observaciones 45 y 46 correspondientes a la secuencia ordenada, o q 09 = 16 376.5. 
Por lo tanto, el recorrido interdecil para los datos del ejemplo 1.1 es de $13 536. 

A lo largo de todo el capitulo se han empleado los ejemplos 1.1 y 1.2 para ilustrar 
varios conceptos. Es importante notar que presentan situaciones contrastantes. El 
primero presenta un conjunto de datos en el que las observaciones se encuentran 
distribuidas de manera uniforme a lo largo del recorrido completo de valores, sin 
ninguna observation relativamente grande. El ultimo ejemplifica una situation en la 
que existe un agregado muy denso de observaciones y algunos valores relativamente 
grandes, especialmente en el extremo superior. La diferencia innata entre estos dos 
ejemplos, puede discernirse a traves de una comparacion de las medidas descriptivas 
numericas que se han calculado para cada uno de ellos y que aparecen en la ta- 
bla 1.11. 

Notese que en el ejemplo 1.1 los valores de las medidas de tendencia central se 
encuentran muy cercanos entre si, mientras que para el ejemplo 1.2 se encuentran se- 
paradas entre si de manera considerable. Se puede decir lo mismo de las desviaciones 
estandar, media y mediana para los dos ejemplos. En el ejemplo primero los valores de 
las desviaciones de la media y de la mediana se encuentran muy proximos al valor 
de la desviacion estandar, mientras que en el ejemplo 1.2 tienen un valor casi similar 
a la mitad de la desviacion estandar. Ademas, en el ejemplo 1.1 el recorrido interde¬ 
cil constituye una proportion relativamente grande del recorrido (22/29 = 0.76), 


TABLA 1.11 Resumen de las medidas numericas descriptivas para los ejemplos 1.1 y 1.2 


Medida 

numerica 

Ejemplo 1.1 

Datos no agrupados Datos agrupados 

Ejemplo 1.2 
Datos no agrupados 

Media 

97.90 

97.75 

9 811.34 

Mediana 

98.50 

98.25 

7 642.00 

Moda 

95.00 

96.50 

— 

Varianza 

61.0154 

61.2179 

105 865 196.80 

Desviacibn est&ndar 

7.81 

7.82' 

10 289.08 

Desviacion media 

6.61 

6.63 

5 561.03 

Desviacibn mediana 

6.60 

6.575 

5 060.60 

Recorrido 

29.00 

— 

63 825.00 

Recorrido intercuantil 

— 

12.50 

5 234.00 

Recorrido interdecil 

— 

22.00 

13 536.00 
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y en el ejemplo 1.2 esta medida es una porcion relativamente pequefia de este ultimo 
(13 536/63 825 = 0.21). 

Estas comparaciones aclaran lo que las medidas numericas y las distribuciones de 
frecuencia pueden hacer para descubrir la naturaleza inherente de un conjunto 
de datos. Sin embargo, el usuario debe tener cuidado tanto en la election como en la in¬ 
terpretation de estas medidas. A pesar de que la media y la desviacidn estandar se han 
empleado de manera extensa como medidas de tendencia central y dispersion respec- 
tivamente, aunque tienen propiedades teoricas muy atractivas existen problemas 
— como el ejemplo 1.2 — para los cuales no pueden ser las medidas mas deseables. En 
general, y por ende, las medidas mas deseables para conjuntos de datos relacionados 
con mediciones fisicas como lecturas de instrumentos, especificaciones de partes, pe¬ 
sos, etc., son la medida y la desviacion estandar o la desviacion de la mediana. Para 
conjuntos de datos relacionados con ingresos y otras informaciones de tipo econo- 
mico y flnanciero, las mejores elecciones para las medidas de tendencia central y dis¬ 
persion son la mediana y la desviacion de la mediana respectivamente. 

Como nota final, las agencias del gobiemo y muchos servicios de information 
proporcionan informacidn en tablas de frecuencia que no solo contienen clases de 
amplitud diferente sino tambien clases abiertas como “ingreso anual de $500 000 
o mas” con el propdsito de tener mayor cobertura de los datos. Estas clases se presen- 
tan en los extremos del conjunto y no se especifican las clases terminales. Como re- 
sultado, el punto medio de las clases abiertas no se encuentra definido y no pueden 
calcularse valores aproximados para algunas medidas numericas como la media, va- 
rianza, desviacidn estbndar y desviacion media, a menos que se encuentren dispo- 
nibles algunas observaciones individuates contenidas en la clase o que sea conocido 
su promedio artimetico. 


Referenda 

1. N.L. Johnson y F.C. Leone, Statistics and experimental design, Vol. I, segunda edition, 
Witey, New York, 1977. 


Ejerddos 

1.1. Los siguientes datos son los lapsos, en minutos, necesarios para que 50 clientes de un 
banco comercial, lleven a cabo una transaccibn bancaria: 


2.3 

0.2 

2.9 

0.4 

2.8 

2.4 

4.4 

5.8 

2.8 

3.3 

3.3 

9.7 

2.5 

5.6 

9.5 

1.8 

4J'- 

0.7 

6.2 

1.2 

7.8 

0.8 

0.9 

0.4 

1.3 

3.L. . 

3.7 

7.2 

1.6 

1.9 

2.4 ' 

4.6 

3.8 

1.5 

2.7 

0.4 

1.3 

l.l 

5.5 

3.4 

4.2 

1.2 

0.5 

6.8 

5.2 

6.3 

7.6 

1.4 

0.5 

1.4 
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a) Construir una distribution de frecuencia relativa. 

b) Construir una distribution de frecuencia relativa acumulada. 

c) Con los resultados de la parte b, determine los recorridos intercuantil e interdecil. 

d) Con los datos agrupados, calcule la media, mediana, moda, desviacion estandar, 
desviacion media y desviacion mediana. 

e) Verificar los resultados de la parte d calculando las mismas medidas para los datos no 
agrupados. 

1.2. La demanda diaria, en unidades de un producto, durante 30 dias de trabajo es: 


38 

35 

76 

58 

48 

59 

67 

63 

33 

69 

53 

51 

28 

25 

36 

32 

61 

57 

49 

78 

48 

42 

72 

52 

47 

66 

58 

44 

44 

56 


a) Construir las distribuciones de frecuencia relativa y de frecuencia acumulada. 

b) Con la distribution acumulada, determine los tres cuantiles. 

c) Calcular la media, mediana, moda, desviacion estandar, desviacion media y des¬ 
viacion mediana, empleando tanto los datos agrupados como los no agrupados, y 
compare los dos conjuntos de resultados. 

d) Comentar la naturaleza de esta distribution de frecuencia, cuando se compara con la 
del ejerticio 1.1. 

1.3. Aqui se presentan tres conjuntos de datos: 

1,2,3, 4. 5, 6; 

1, 1, 1, 6, 6, 6; 

-13, 2, 3, 4, 5, 20. 


Calcular la media y la varianza para cada conjunto de datos. iQue se puede concluir? 

1.4. La siguiente tabla muestra las ventas, en miles de dolares, de 2D vendedores de una 
compafiia de computadoras. 


40.2 

29.3 

35.6 

88.2 

42.9 

26.9 

28.7 

99.8 

35.6 

37.8 

44.2 

32.3 

55.2 

50.6 

25.4 

31.7 

36.8 

45.2 

25.1 

39.7 


a) Calcular la media, mediana, desviatidn estandar, desviacion mediana, recorrido in¬ 
tercuantil y recorrido interdecil. 

b) iQue medidas de tendentia central y dispersidn se eiegirian y por que? 

1.5. Con los datos del ejerticio 1.2, sea jt, la demanda del i-esimo dia para i = 1, 2 ... 30. 
Transformar los datos por medio de la relatidn 

,^^'kk . • _ Xj — 51.5 

| 4 .| 7 • • 
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a) Construir una distribution de frecuencia relativa para los datos transformados. <,Ha 
ocurrido algun cambio en la naturaleza de la distribucion de frecuencia cuando esta 
se compara con la del ejercicio 1.2? 

b) Con los datos transformados n ,, calcular la media y la desviacion estandar; mostrar 
que son iguales a cero y uno respectivamente. 

1.6. Los siguientes datos agrupados representan los pagos por almacenamiento para los 50 mas 
grandes detallistas durante el aflo 1979: 


Umites de estructura de la clase Frecuencia 


1.10-1.86 

4 

1.87-2.63 

14 

2.64-3.40 

11 

3.41-4.17 

9 

4.18-4.94 

7 

4.95-5.71 

I 

5.72-6.48 

2 

6.49-7.25 

2 


a) Graficar la distribution de frecuencia relativa acumulada. 

b) Con los resultados de la parte a), determinar los recorridos intercuantil e interdecil. 

c) Calcular la media, mediana y moda. 

d) Calcular la varianza, desviacion estandar, desviacion media y desviatiOn mediana. 

1.7. La siguiente information agrupada representa el numero de puntos anotados por equipo 
y por juego en la Liga National de Futbol durante la temporada de 1973: 


Crupo Frecuencia 


0-3 

27 

4-10 

66 

11-17 

91 

18-24 

70 

25-31 

57 

32-38 

34 

39-45 

16 

46-52 

3 


a) Graficar la distribution de frecuencia relativa. 

b) Calcular la media y la moda. 

c) Calcular la varianza, desviacion estandar y desviacion media. 

1.8. Se seleccionaron de un proceso de fabrication, aleatoriamente, 20 baterias y se llevd a 
cabo una prueba para determinar la duration de festas. Los siguientes datos representan 
el tiempo de duraciOn, en horas, para las 20 baterias: 


52.5 

62.7 

58.9 

65.7 

49.3 

58.9 

57.3 ' 

60.4 

59.6 

58.1 

62.3 

64.4 

52.7 

54.9 

48.8 

56.8 

53.1 

58.7 

61.6 

63.3 


a) Determinar la media y la mediana. 

b) Determinar la desviatiOn estandar, desviaciOn media y desviaciOn mediana. 

c) Determinar los recorridos intercuantil e interdecil. 
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APENDICE 

Sumatorias y otras notaciones simbolicas 

El uso de la notation simbolica es esencial en estadistica. Por ejemplo, para distin- 

guir entre los valores de n observations se emplea la notation simbolica x u x 2 . 

;c„.Uno de los simbolos mas utiles es la letra griega X (sigma) con que se denota la 
suma de terminos en una secuencia. De esta manera la suma de x 1 x n se desig- 
na por 


E Xj = .V, + + ••• + x„, 

i= I 

y se lee “la suma de las jc, , con / variando desde 1 hasta n”. La letra / retibe el 
nombre de indice de suma y toma valores enteros sucesivos hasta e incluyendo a n, 
que es el limite superior o el valor mas grande de i. Los siguientes son ejemplos del 
uso de X 

n 

a) 2 x 2 , = x] + x] + + x 2 n ; 

1=1 

n 

b) E (-*■/ - a) = (*i - a) + (x 2 - a) + + (x„ - a); 

J= I 
n 

c) E (*/• - «) 2 = (*i - a ) 1 + (*2 - a f + + (*n - a) 2 ; 

/= I 

n 

d) E x >y> = *\y\ + x 2y~2 + + x„y n . 

i= 1 

Las siguientes tres propiedades son importantes cuando se emplea el simbolo X, 
Propiedad 1. Si c es cualquier constante, entonces 



Propiedad 2. Si c es cualquier constante, entonces 

n 

E c = nc. 

/* 1 

Propiedad 3. 


E(*. + y>) = E x < + E y>-- 

i=i i=l i'=l 
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Las propiedades anteriores pueden verificarse de la siguiente manera: 

n 

1) 2 CJf, = CX t + CX2 + ”• + CV„ 

/* 1 

= c(x I + .r 2 + ••• •+ .V„) 

- <• 2 Jr,. 

i= I 

M 

2) X c ' ~ c + c + ••• + c 

n terminos 

= (1 + 1 + — + l)c 

^ „ - * 

n terminos 

= nc. 

n 

3) 'ZUj + y,) = (jt, + y,) + (x 2 + y 2 ) + — + (x„ + y„) 

i= t 

= C*i + x 2 + + r„) + (>>, + y 2 + + y„) 

i= i /=» 

El simbolo 2 tambien se emplea para denotar la suma sobre dos caracteristicas 
diferentes. Por ejemplo, supongase que se tiene la funcion p(x, y) de las variables x y 
y, las que toman unicamente valores enteros. En particular x toma los valores ente- 
ros de 0 y 1, y y valores 1, 2 y 3. Entonces la suma de p(x, y) sobre todos los valo¬ 
res tanto de x como de y se denota por 

I 3 

2 2 />(*,*) = P( o, 1) + p(0, 2) + p( 0, 3) + p( 1, 1) + p(l, 2) + p(l, 3). 


Notese que primero se elige el indice de suma de x igual a cero y entonces se evalua la 
suma interna para cada uno de los valores del indice de suma de>». Posteriormente se 
incrementa el indice de suma de x en uno y se repite el proceso. El procedimiento an¬ 
terior tambien se aplica a todas aquellas situariones en las que se emplean subscritos 
dobles para distinguir entre dos caracteristicas. Por ejemplo, considere la suma de la 
secuencia x ,,, / = 1,2 ... n,j = 1,2... m para todos los valores posibles de i y dey. 
Tal suma puede denotarse por 

n in 

•. 2 2 x u- 
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En particular, si n - 2 y m = 3, entonces 

2 3 

X 2 *-/ = *11 + *12 + *13 + *21 + *22 + *23- 
i- I ./= ( 

Otro simbolo ultil es la letra griega n (pi). Esta letra se emplea para indicar el 
producto de los terminos de una secuencia. Por ejemplo, dada la secuencia de obser- 
vaciones x y , _r 2 , .... x„, el producto de x ,, x 2 , .... *„ se denota por 

n 

n x '= * 1*2 • 

i 

en donde la letra / tiene el mismo proposito que en la suma. 
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CAPlTULO DOS 

Conceptos en probabilidad 


2.1 Introduction 

La probabilidad es un mecanismo por medio del cual pueden estudiarse sucesos alea- 
torios, cuando fetos se comparan con los fendmenos deterministicos. Por ejemplo, 
nadie espera predecir con certidumbre el resultado de un experimento tan simple 
como el lanzamiento de una moneda. Sin embargo, cualquier estudiante de primer 
afio de licendatura en fisica debe ser capaz de calcular el tiempo que transcurrir& 
para que un objeto, que se deja caer desde una altura conocida, llegue al suelo. 

La probabilidad tiene un papel crucial en la aplicacion de la inferencia estadistica 
porque una decision, cuyo fundamento se encuentra en la informacidn contenida en 
una muestra aleatoria, puede estar equivocada. Sin una adecuada comprension de las 
leyes b&sicas de la probabilidad, es dificil utilizar la metodologia estadistica de ma- 
nera efectiva. 

Para ilustrar el uso de la probabilidad en la toma de decisiones, considerese el si- 
guiente ejemplo: una compaflia produce un detergente liquido que se envasa en bo- 
tellas de 500 ml, las que son llenadas por una m&quina. Debido a que las botellas que 
contienen una cantidad mayor de 500 ml representan una perdida para la compaflia 
y todas aquellas que contienen una cantidad menor constituyen una pfedida para el 
consumidor (lo que puede desencadenar una acci6n legal en contra de la compaflia), 
la compaflia realiza todos los esfuerzos necesarios para mantener el volumen neto 
promedio en un nivel de 500 ml. Para mantener un control apropiado se ideo el si- 
guiente esquema de muestreo: se seleccionar&n 10 botellas del proceso de llenado, 
cuatro veces durante el transcurso del dia y se determinari su contenido neto prome¬ 
dio. Si fete se encuentra entre 498 y 502 ml, inclusive, el proceso se considerar& 
“bajo control”; de otra manera, fete se encontrar& ‘‘fuera de control”. En este caso 
se detendrii d llenado, llevando a cabo todos los esfuerzos necesarios para determi- 
nar la causa, si es que feta existe, del problema. Con toda seguridad y para cual- 
quiera de las dos situaciones se tienen riesgos. Si el proceso se considera bajo 
control, podria encontrarse fuera de fete, y la compaflia puede estar perdiendo el 
producto o sujetimdose a una acfci6n legal por parte de las correspondientes oficinas 
del gobiemo. Por otro lado si el proceso se considera fuera de control, puede en rea¬ 
lidad encontrarse bajo control y la compaflia estar& intentando localizar una falla 
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inexistente. La evaluation de estos riesgos solo puede hacerse de manera efectiva a 
traves del uso de la probabilidad. 

En las tres secciones siguientes se examinar&n las interpretaciones cldsica, defre- 
cuencia relativa y subjetiva, de la probabilidad. Las dos primeras son muy similares 
debido a que se basan en la repetition de experimentos realizados bajo las mismas 
condiciones, como el lanzamiento de una moneda. La interpretation subjetiva o per¬ 
sonal de la probabilidad representa una medida del grado de creencia con respecto a 
una proposition, como podria ser si la creaci6n de una nueva empresa tendrO exito. 
En la section 2.5 se establecen algunos axiomas y, con base en estos, se define for- 
malmente la probabilidad. El desarrollo axiom&tico incluye las tres interpretaciones 
de la probabilidad. 

2.2 La definition cl&sica de probabilidad 

El desarrollo inicial de la probabilidad se asocia con los juegos de azar. Por ejemplo, 
considerense dos dados que se distingan y que no estan cargados; el interes recae en 
los numeros que aparecen cuando se tiran los dados. En la tabla 2.2 se dan los 36 po- 
sibles pares de numeros. 

Una caracteristica clave de este ejemplo, asi como tambien de muchos otros rela- 
cionados con los juegos de azar, es que los 36 resultados son mutuamente excluyen- 
tes debido a que no puede aparecer m&s de un par en forma simult&nea. Los 36 resul¬ 
tados son igualmente probables puesto que sus frecuencias son practicamente las 
mismas, si se supone que los dados no estan cargados y que el experimento se lleva a 
cabo un numero suficientemente grande de veces. Notese que de los 36 resultados 
posibles, seis dan una suma de siete, cinco dan una suma de ocho, etc. Por Jo tanto, 
puede pensarse de manera intuitiva que la probabilidad de obtener un par de nume¬ 
ros cuya suma sea siete es la proporcion de resultados que suman siete con respecto 
al numero total, en este caso 6/36. Es importante que el lector comprenda que la 
proporcion 6/36 se obtiene unicamente despufes de que el experimento se realiza un 
numero grande de veces, es decir, despufes de efectuar el experimento muchas veces 
se observari que, alrededor de la sexta parte de este, la suma de los numeros que 
aparecen es igual a siete. La proporci6n 6/36 no significa que en seis tiradas, forzo- 
samente una dash como resultado un siete. Para situaciones de este tipo es apropiada 
la siguiente definition de probabilidad. 

Definition 2.1 Si un experimento que estO sujeto al azar, resulta de n formas igual¬ 
mente probables y mutuamente excluyentes, y si n A de estos resultados tienen un 
atributo A, la probabilidad de A es la proportion de n A con respecto a n. 


TABLA 2.1 Posibles resultados que aparecen cuando se lanzan dos dados 


1.1 

1,2 

1,3 

1,4 

1,5 

1,6 

2,1 

2,2 

2,3 

2,4 

2,5 

2,6 

3.1 

3,2 

' 3,3 

3.4 

3,5 

3,6 

4,1 

4,2 

4,3 

4,4 

4,5 

4,6 

5,1 . 

5,2 

5,3 

5,4 

5,5 

5,6 

6,1 

6,2 

6,3 

6,4 

6,5 

6,6 
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2.3 Definition de probabilidad como frecuencia relativa 

i 

En muchas situaciones pr&cticas, los posibles resultados de un experimento no son 
igualmente probables. Por ejemplo, en una f&brica las oportunidades de observar un 
artlculo defectuoso normalmente ser& mucho mis rara que observar un artlculo 
bueno. En este caso, no es correcto estimaf la probabilidad de encontrar un artlculo 
defectuoso mediante el empleo de la definition clasica. En lugar de esta, en muchas 
ocasiones se emplea la interpretation de la probabilidad como una frecuencia rela¬ 
tiva. 

La interpretacion de una frecuencia relativa descansa en la idea de que un experi¬ 
mento se efectua y se repite muchas veces, y pr&cticamente bajo las mismas condi- 
ciones. Cada vez que un experimento se lleva a cabo, se observa un resultado. £ste es 
impredecible dada la naturaleza aleatoria del experimento, la probabilidad de la pre- 
sencia de cierto atributo se aproxima por la frecuencia relativa de los resultados que 
posee dicho atributo. Conforme aumenta la repeticibn del experimento, la frecuen¬ 
cia relativa de los resultados favorables se aproxima al verdadero valor de la proba¬ 
bilidad para ese atributo. Por ejemplo: supbngase que se desea determinar la pro- 
porci6n de articulos defectuosos en un proceso de fabricacibn. Para llevar a cabo lo 
anterior, se muestra un determinado numero de articulos; cada observaci6n consti- 
tuye un experimento. Los resultados pueden clasificarse como defectuosos o no defec¬ 
tuosos. Si el proceso de fabricacibn es estable, y asegura asi las condiciones unifor¬ 
mes, al aumentar el numero de articulos muestreados, la frecuencia relativa de 
articulos defectuosos con respecto al nhmero de unidades muestreadas se aproxima- 
rk cada vez m&s a la verdadera proporcion de articulos defectuosos. 

Para ilustrar la interpretacibn de la probabilidad como frecuencia relativa se si- 
mulo en una computadora un proceso de muestreo de n unidades, suponiendo que el 
proceso de fabricacibn produda un 5% de articulos defectuosos. Para cada n se ob- 
servo el numero de unidades defectuosas; los resultados se dan en la tabla 2.2 para 
valores de n entre 20 y 10 000. A partir de esto es razonable concluir que la frecuen¬ 
cia relativa tiende a un valor verdadero de 0.05 conforme n crece. De esta manera, se 
sugiere la siguiente definicibn de la probabilidad como frecuentia relativa: 


TABLA 1.1. Resultados de un experimento simulado en computadora 


Numero de unidades 
muestreadas (n) 

Numero de unidades 
defectuosas observadas 

Frecuencia 

relativa 

20 


2 

0.10 

50 

. : ' ' \ 

3 

0.06 

100 


4 

\ 0.04 

200 


12 

0.Q6 

500 ; » ' 

M- : 

28 ' 


1 000 

* . "it • • •'• 

54 • .W: 


2 000 r . 

. 1 

97 

*1 & \ aSai 

5000 

1 

244 

■v BVi! 

10 000 


504 

0.0504 
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Definici6n 2.2 Si un experimento se repite n veces bajo las mismas condiciones y 
n H de los resultados son favorables a un atributo B, el limite de njn conforme n se 
vuelve grande, se define como la probabilidad del atributo B. 

2.4 Interpretation subjetiva de la probabilidad 

La repeticion de un experimento bajo las mismas condiciones es la base para las in- 
terpretaciones cl&sica y de frecuencia relativa de la probabilidad. Sin embargo, 
muchos fenomenos no se prestan para repeticion, pero a pesar de esto requieren 
de una notion de probabilidad. Por ejemplo la compaflia que asegurd los Juegos 
Olimpicos de 1980 tuvo que determinar, a priori, los riesgos de que los juegos no se 
efectuasen de la manera en que se habian planeado. O cuando se aseguran contra 
robo o daflo esculturas y pinturas cuyo valor es muy alto, las compaflias aseguradoras 
deben tener idea de los riesgos adquiridos para fijar de manera adecuada, el precio 
del seguro. En ninguno de estos ejemplos puede concebirse un experimento suscep¬ 
tible de llevarse a cabo bajo condiciones similares. Por otra parte, muchas de las 
afirmaciones que suelen formularse las personas de algun modo implican probabili¬ 
dad. Por ejemplo, cuando se dice “probablemente el embarque llegarti maflana”, o 
cuando un corredor de bolsa asesora a un cliente sobre la posible alza de una action, 
se est& sugiriendo alguna idea de la probabilidad de ocurrencia de las afirmaciones 
anteriores. 

Para los ejemplos anteriores, la interpretaci6n de la probabilidad no puede tener 
su fundamento en la frecuencia de ocurrencia. La probabilidad se interpreta como el 
grado de creencia o de conviccidn con respecto a la ocurrencia de una afirmacidn. En 
este contexto, la probabilidad representa un juicio personal acerca de un feriomeno 
impredecible. Esta interpretacidn de la probabilidad se conoce como subjetiva o per¬ 
sonal. 

Es importante hacer hincapie en que la probabilidad subjetiva tambien puede 
aplicarse a experimentos repet'Hvos. Por ejemplo, un jugador de blackjack puede, en 
un momento dado, decidir tomar otra carta y hacer caso omiso de su experiencia 
previa, debido a que cree que esto aumentarit sus oportunidades de ganar la mano. 
El capitcui de un equipo de futbol puede pedir “cara” cuando la moneda se lance al 
aire, debido a que fcsa es su creencia con respecto al resultado de arrojarla. Con base 
en tales aplicaciones, la probabilidad subjetiva es considerada por muchos como 
m&s general que las otras dos interpretaciones. 

Para ilustrar la traslacion de im grado de creencia en probabilidad, considere la 
siguiente situation: se pregunta a dos ingenieros petroleros, A y B, su opinion acerca 
de la posibilidad de descubrir petroleo en un determinado sitio. La respuesta de A es 
que el estk seguro, en un 80%, de que se encontrara petroleo mientras que B lo esta 
en un 70%.* El porcentaje dado por los ingenieros es una medida de la creencia de 
fcstos, con respecto al descubrimiento de petrdleo. De esta manera se pueden asignar 
distintas medidas de creencia a la misma proposition. Pero <,que significado tienen 
realmente el 80% y 7%? La interpretation comun es la siguiente. El ingeniero A pien- 

* Por implicaci6n. Ay B tambign est&n diciendo que se encuentran seguros, en un 20% y 30%, respecti- 
vamente, de que no scrii descubierto el petrbleo. 
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sa apostar ocho a dos (por ejemplo $8 contra $2 o cualquier otra cantidad de dolares 
que se encuentre en la misma proportion) a que el petroleo sera descubierto en ese si- 
tio. De manera similar, B cree que es mejor apostar siete a tres (es decir $7 contra $3) 
para el mismo resultado. De esta manera, las probabilidades subjetivas de A y B se 
definen como las proporciones 8/(8 + 2) y 7/(7 + 3) respectivamente. En general si 
las apuestas en favor de una afirmacidn son de c a d, la probabilidad de esta es 
c/(c + d). 

2.5 Desarrollo axiomatico de la probabilidad 

Para formalizar la definicion de probabilidad, a traves de un conjunto de axiomas, 
se repasaran brevemente los conceptos basicos de la teoria de conjuntos (o eventos), 
sobre los cuales se fundamenta la definicion formal de probabilidad. Esta definicidn 
es tan general que permite incorporar las distintas interpretaciones de la probabili¬ 
dad, mencionadas anteriormente. 

La coleccion de todos los posibles resultados de un experimento aleatorio es im- 
portante en la definicion de la probabilidad. Para definir esta coleccion considerense 
los siguientes experimentos: el numero de reservaciones no canceladas para un 
vuelo, el numero de llegadas a un servicio o la duracion de un determinado compo- 
nente. Todos son ejemplos de fenomenos impredecibles con un determinado numero 
de posibles resultados. El numero de reservaciones no canceladas puede ser cual¬ 
quier entero positivo no mayor que el numero de asientos del avion; el numero de 
llegadas puede ser, teoricamente, cualquier entero positivo sin ningun limite, y la du- 
raci6n de un componente puede ser cualquier numero real positivo. Lo anterior 
lleva, de manera inmediata, a la siguiente definicion: 

Definici6n 2.3 El conjunto de todos los posibles resultados de un experimento 
aleatorio recibe el nombre de espacio muestral. 

El conjunto de todos los posibles resultados puede ser finito, infinito numerable 
o infinito no numerable. Por ejemolo, el numero de reservaciones sin cancelar cons- 
tituye un espacio muestral finito, dado que este numero nunca exceder& la capacidad 
del avion, que es finita. El numero de llegadas al servicio constituye un espacio 
muestral infinito numerable, dado que es posible colocar los resultados en una co¬ 
rrespondence uno a uno con los enteros positivos, que constituyen un conjunto 
infinito pero numerable. La duraciOn de una componente constituye un espacio 
muestral infinito innumerable, dado que festa puede ser cualquier numero real positi¬ 
vo. En este momento, es conveniente dar las siguientes definiciones. 

Definki6n 2.4 Se dice que un espacio muestral es discreto si su resultado puede 
ponerse en una correspondencia uno a uno con el conjunto de los enteros positivos. 

Definid6n 2.5 ‘<Se dice que un espacio muestral es continuo si sus resultados consis- 
teh de wfintervalo de numeros reales. - , : 

.y 

f 

Con respecto a los resultados de un espacio muestral, se puede estar particular- 
mente interesado en un subconjunto de 6stos. Por ejemplo, un gerente de cierta linea 
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aerea desea saber si el numero de reservaciones sin cancelar es menor que cinco, o 
bien un comprador de baterias desea saber si estas tendrOn una operation normal 
mayor de 40 horas. De esta manera, se tiene la siguiente definition: 

Definition 2.6 Un evento del espacio muestral es un grupo de resultados conteni- 
dos en este, cuyos miembros tienen una caracteristica comun. 

Por caracteristica comun debe entenderse que unicamente un grupo de resulta¬ 
dos en particular satisface la caracteristica y los restantes, contenidos en el espacio 
muestral, no. Se dice que ha ocurrido un evento si los resultados del experimento 
aleatorio incluyen a algunos de los que definen al evento. En este contexto, el espa¬ 
cio muestral, evento en si mismo, puede entenderse como un evento seguro, puesto 
que se tiene un 100% de certidumbre de que ocurrirO un resultado del espacio 
muestral cuando el experimento se lleve a cabo. Para completar se dan las siguientes 
definiciones: 

Definition 2.7 El evento que contiene a ningun resultado del espacio muestral re- 
cibe el nombre de evento nulo o vaclo. 

Deber&n recordarse algunas definiciones de la teoria de eventos. Sean £, y £ 2 
cualesquiera dos eventos que se encuentren en un espacio muestral dado denotado 
por S. 

Definition 2.8 El evento formado por todos los posibles resultados en £, o £ 2 o en 
ambos, recibe el nombre de la unidn de £, y £ ? y se denota por £, U E 2 . 

Definition 2.9 El evento formado por todos los resultados comunes tanto a £, 
como a E 2 recibe el nombre de interseccion de £, y E 2 y se denota por £, fl E 2 . 

Definition 2.10 Se dice que los eventos E, y E 2 son mutuamente excluyentes o dis- 
juntos si no tienen resultados en comun; en otras palabras £, n £ 2 = 0 * evento 
vacio. 

Definition 2.11 Si cualquier resultado de E 2 tambiOn es un resultado de E ] , se dice 
que el evento E 2 estO contenido en £,, y se denota por £ 2 C £, . 

Definition 2.12 El complement de un evento E con respecto al espacio muestral 
S, es aquekjue contiene a todos los resultados de S que no se encuentran en £, y se de¬ 
nota por E. 

Las definiciones anteriores pueden demostrarse de mariera grOfica mediante el 
uso de los diagramas de Venn, como se muestra en la figura 2.1. _ 

Como ejemplo, considerese el experimento de lanzar un dado; el espacio 
muestral es S (1, 2, 3, 4, 5, 6). Se definen los'eventos E, = (2; 4, €),' £ 2 ,v = : (11 3), 
y £ 3 = (2, 4). Es fOcil verificar que £, U £ 2 = (1, 2, 3, 4, 6), £,' n £ 3 =_(2,:- 
4), £1 fl £ 2 = 0, £3 se encuentra completamente contenido en E, y £ 2 = 
(2,4,5,6). " 
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FIGURA 2.1 Diagramas de Venn que ilustran a) la uni6n de dos eventos; b) la intersecci6n 
de dos eventos; c) eventos mutuamente excluyentes; d) un evento contenido en otro, y e) un 
evento y su complemento 


La probabilidad es un numero real que mide la posibilidad de que ocurra un re- 
sultado del espacio muestral, cuando el experimento se lleve a cabo. Por lo tanto, la 
probabilidad de un evento tambien es un numero real que mide la posibilidad colec- 
tiva, de ocurrencia, de los resultados del evento cuando se lleve a efecto el experi¬ 
mento. A continuation se da la definicion axiomatica de la probabilidad. 

Definition 2.13 Sean S cualquier espacio muestral y E cualquier evento de este. Se 
llamara funcion de probabilidad sobre el espacio muestral S a P(E) si satisface los si- 
guientes axiomas; 

1. P(E)> 0 

2. P(S) = 1 

3. Si, para los eventos E u E 2 , Ej, ..., 

Ef fl Ej = 0 para toda i j, entonces 
P(E t UE 2 U •••) = />(£,) + P(E 2 ) + •••. 

La raz6n de estos tres axiomas se convierte en aparente cuando, por ejemplo, se 
recuerda la interpretacion de la probabilidad como una frecuencia relativa. Es decir, 
la probabilidad de un evento refleja la proporcion de veces en que ocurrira cuando el 
experimento se repita. Los axiomas tambien son evidentes para la interpretacion 
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subjetiva de la probabilidad, dado que para esta cualquier grado de creencia se con- 
vierte en una proporcibn. De ahi que las probabilidades exhiban las caracterlsticas 
de las proporciones, en las que la probabilidad es un numero entre cero y uno, y 
dado que es forzoso que ocurra un resultado cuando se lleva a efecto un experimen- 
tb, la probabilidad de S es uno. Adem&s si no hay ningun resultado en comun entre 
dos eventos E t y E 2 , la probabilidad de que ocurra E t oE 2 es igual a la proporcibn de 
veees en que ocurre E x mas la proporcibn de veces en que ocurra E 2 . 

En seguida se demostrarbn algunas de las consecuencias de estos tres axiomas. 

Teorema 2.1 / > C0) = 0. 

Demostracidn: 

5 U 0 = 5 y 5 0 0 = 0. 

Por el axioma 3, 

P(S U 0) = P(S ) 4- / > (0); 

pero por el axioma 2, P(S) = 1, y de esta manera P(0) = 0. 

Teorema 2.2 Para cualquier evento E C S, 0 P(E) =£ 1. 

Demostracidn: Por el axioma 1, P(E) > 0; de aqui que sblo es necesario pro¬ 
bar que P(E) « 1. 

EUE = S y £D£ = 0. 

Por los axiomas 2 y 3, 


P(EUE) = P(E) + P(E) = P(S) = 1; 
dado que P(E) 5 = 0, P(E) 1. 

El axioma 3 da la probabilidad de la unibn de dos eventos disjuntos. Por otro 
esta porcibn de la suma de P{ A) y P(B). El teorema se reduce al axioma 3 cuando 
la probabilidad de la unibn de dos eventos que no son, necesariamente, disjuntos? 
Para dar respuesta a las preguntas anteriores se enuncia el siguiente resultado gene¬ 
ral, el que usualmente recibe el nombre de regia de adicion de probabilidades. 

Teorema 2.3 Sea S un espacio muestral que contiene a cualesquiera dos eventos A 
y B\ entonces, 

P(A U B) = P(A) + P(B) - P(A n B). 

Aun cuando no se pretende dar aqui una demostracion formal del teorema, este 
es intuitivamente razonable. P(A) y P(B) reflejan el numero de veces en que ocurri- 
r&n los resultados de A y B, respectivamente. Sin embargo, y teniendo en cuenta lo 


www. FreeLibros. com 



36 Conceptos en probabilidad 

anterior, los resultados comunes ser&n contados dos veces con la necesidad de restar 
esta porcibn de la suma de P(A) y P(B). El teorema se reduce al axioma 3 cuando 
los eventos son disjuntos. ; , -rr , 

Ejemplo 2.1 Un sistema contiene dos componentes A y B, y se conecta de ma- 
nera que fete funciona si cualesquiera de las componentes funciona. Se sabe que la 
probabilidad de que A funcione es P(A) = 0.9 y la de B es P(B) = 6.8 y la probabi¬ 
lidad de ambos es P(A fl B) = 0.72. Determinar la probabilidad de que el sistema 
funcione. 

La probabilidad de que el sistema trabaje es igual a la probabilidad de la uni6n 
entre A y B; de esta manera, 

P(A U B) = P(A) + P(B) - P(A n B) 

= 0.9 + 0.8 - 0.72 = 0.98. 


2.6 Probabilidades conjunta, marginal y conditional 

En esta seccion se examinan los conceptos de probabilidad conjunta, marginal y 
condicional, y se desarrolla la ley de multiplication de probabilidades. Considerese un 
experimento en el que se elige aleatoriamente una persona adulta que viva en una 
ciudad con n personas adultas, y se anotan sus caracteristicas con respecto a su habi- 
tos de fumador y su sexo. Sea el espacio muestral la poblacion de adultos de la 
ciudad, que se divide en los siguientes eventos disjuntos: fumador A, y no fumador 
A 2 , hombre fl, y mujer B 2 ■ Los eventos en S pueden representarse como se muestra 
en la tabla 2.3. 

Como ejemplo, notese que n u de los n adultos son hombres que fuman, por lo 
que son poseedores de los atributos A, y . Supongase que se desea determinar la 
probabilidad de ocurrencia simult&nea de los eventos A, yB 2 . Mediante el empleo de 
la interpretacibn de frecuencia relativa, puede argumentarse que, dado que exacta- 
mente nj 2 de los n adultos poseen ambos atributos, A, y B 2 , la probabilidad esn ]2 /n. 
Esta ultima recibe el nombre de probabilidad conjunta puesto que se insiste en la 
probabilidad de resultados comunes a ambos eventos A, y B 2 . Por lo tanto la proba¬ 
bilidad de los eventos A, y B ! estti dada por 

P(A, n Bj) = n u /n. 


TABLA 2.3 Clasificacion de n adultos mediante su sexo y habitos de fumadores 


Ai 

A 2 


B | B 2 


"ll 

n i 2 


^22 
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Sup6ngase que ahora el interns recae en determinar la probabilidad'A„. sin consi- 
derar cualquier otro even to Bj del espacio muestral S. Para especificar, supbngase 
que se neeesita la probabilidad del evento A 2 . Haciendo uso de nuevo de la interpre- 
tacibn de frecuencia relativa, el numero total de personas no fumadoras (A 2 ) es n 2 , 
+ n 22 ;de esta manera se tiene 

P(A 2 ) - (n 2 | + n} 2 )/n. 


Este tipo de probabilidad se conoce como marginal porque para determinarla se ig- 
noran una o mas caracteristicas del espacio muestral. De lo anterior se sigue que 

P(A,) = X n,j/n. 


pero dado que 


P{A, n Bj) = njn. 

2 

P(A,) = I P(A, n Bj). 

y* I 


En otras palabras, la probabilidad marginal de un evento A, es igual a la suma de las 
probabilidades conjuntas de A, y Bj , donde la suma se efectua sobre todos los even- 
tos Bj. De manera similar la probabilidad marginal de B, esta dada por 

2 

P(Bj) = 2 P(A, n Bj). 

i= I 

En este punto yadebe ser obvia la extensibn para incluir mbs de dos eventos disjuntos. 

Finalmente, supbngase que el interes recae en determinar la probabilidad de un 
evento A, , dado que ha ocurrido el evento Bj. Por ejemplo, regresando a la tabla 
2.3, supbngase que se ha elegido aleatoriamente una muj er adulta. (B 2 ) Ahora bien, 
i,cu41 es la probabilidad de que fume? Una vez mas, el argumento descansa sobre la 
interpretacion de frecuencia relativa. Sin embargo, una vez que el evento “mujer” 
ha ocurrido, este reemplaza a S como el espacio muestral de interes. Por lo tanto, la 
probabilidad de tener un fumador (A i ) es el numero de mujeres que fuman (n r ) 
entre el numero total de estas (/i l2 + « 22 ).Por lo tanto 


P(A,|B 2 ) = n [ 2 /{n | 2 + n 22 ). 


donde la barra vertical se lee como “dado que” y separa al evento A,. cuya probabi¬ 
lidad estb condicionada a la previa ocurrencia del evento B 2 . Esta recibe el nombre 
de probabilidad condicional de A, dada la ocurrencia de B 2 . En general, se tiene que 

. 2 

P(A\B t ) = (2A) 

1= I 
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y por simetria, ^ 


i''-'i ■ \. •!?!- :'fy 

:f. 2 '(• V’A l• OAi.ivA .■' i 

a .„■ (2.2) 




-■t'i 


V 


■ •:v - l':- ■■ J 


A1 dividir el numerador y denominador del miembro derecho de (2.1) por n, se tiene 

P(A,\Bj) = 

2 n J n 


1=1 


pero 


por lo tanto 


P(Aj n Bj) = tijjfn 

2 

p(Bj) = 2 «<//«; 


m,R) = P(A f^f ] > P{Bj) > °’ 


y de manera equivalente 


mK) = P(A p ( A^ ] > p(a,)>o. 

*\ A i) 


(2.3) 


(2.4) 


Para definir las probabilidades con junta, marginal y condicional se ha empleado 
un ejemplo espedfico en el que el espacio muestral contiene unicamente un numero 
finito de resultados. Sin embargo, las definiciones dadas aqui son completamente 
generales y pueden extenderse para incluir cualquier espacio muestral ya sea discreto 
o continuo. Con base en lo anterior se define de la siguiente manera. 


Definition 2.14 Sean Ay B cualesquiera dos eventos que se encuentran en un espa¬ 
cio muestral S de manera tal que P(B) > 0. La probabilidad condicional de A al 
ocurrir el evento B, es el cociente de la probabilidad conjunto deAyB con respecto 
a la probabilidad marginal de B; de esta manera se tiene 

P(A\B) = P(A p( n m B) , P(B) > 0. (2.5) 

La relaci6n entre (2.5) puede escribirse como un producto, lo que da como resul- 
tado la regia de multiplication de probabilidades, dada por 


P(A C\B) = P(B)P(A\B). 
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Por simetria, la probabilidad conditional de B dada la ocurrencia de A, es j 0:i 


p (B\A) = ^~~ , P(A)>0. 

-r vnv . ■ / (A) ’ 


De esta manera se tiene 




-• oh 




que es otra version de la regia de multiplicacion, la que unplica que 

P(A)P(B\A) = P(B)P(A\B). (2.7) 

La definicion 2.14 puede extenderse para incluir cualquier numero de eventos 
que se encuentren en el espacio muestral. Por ejemplo, puede demostrarse que para 
tres eventos A, By C 

P(A\B nc) = P { - p ^ B * ^ c) , P(B n C) > 0 (2.8) 

y 

P{A n fi|C) = - (A - ^ ) nc) , P(C) > 0. (2.9) 

Los siguientes ejemplos ilustrarin los conceptos presentados en esta seccidn. 

Ejemplo 2.2 A los habitantes de una gran ciudad se les hizo una encuesta con el 
proposito de determinar el numero de lectores de Time y Newsweek. Los resultados 
de la encuesta fueron los siguientes: 20% de los habitantes leen el Time, el 16% lee el 
Newsweek y un 1% lee ambos semanarios. Si se selecciona al azar a un lector de 
Time, icu&l es la probabilidad de que tambi&n lea el Newsweek? 


Sean A y B los eventos que representan el numero de lectores del Time y News¬ 
week respectivamente; dado que P(A) = 0.2, P(B) = 0.16 y P(A D B) = 0.01, 

P(B|A) = 0.01/0.2 = 0.05. 

Por otra parte, tambien puede determinarse la probabilidad de que un lector del 
Newsweek lea tambien el Time ; esto es 

P{A\B) = 0.01/0.16 = 0.0625, 

y se verifica la relation P{A)P(B\A) = P{B)P(A\B), o (0.2)(0.05) (0.16)(0.0625). 

Ejemplo 2.3 Muchas instituciones bancarias emplean modelos computarizados de 
credito con el proposito de dar un determinado puntaje a todas las solicitudes 
de prestamo. Este puntaje se emplea como una ayuda para decidir cuando se otorga 
el prestamo. Supongase que el 3% de todos los prestamos que se otorgan presentan 
problemas por incumplimiento de pago y que los modelos de credito son precisos en 
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un 80% al predecir menos crfeditos. Si el 85% de todas las solicitudes reciben pun- 
tuaciones favorables por los modelos computarizados y se les otorga el prfcstamo, 
determinar la probabilidad de que una solichud que recibe una puntuacibn favo¬ 
rable y a la que se le otorga el prfestamo, no presente ningun problema para el pago 
de fcste. 

Sea A el evento incumplimiento de pago y B la puntuacibn favorable. Del 
enunciado del problema setiene que P(A) = 0.03, P(B) = 0.85 y P(B\A) = 0.8, en 
donde A es el complemento de A , es dedr, el evento cumplimiento de pago. Lo que 
se busca es la probabilidad condidonal de que no exista ningun problema en elj>ago 
del prestamo, dado que la solidtud obtuvo una puntuacibn favorable, o P{A\B). 
Usando la relation (2.7), se tiene 

P(B)P(A\B) = P(A)P(B\A), 


o 


P(A\B) = 


P(A)P(B\A) 
P(B ) 


y dado que P(A) = 0.97, la probabilidad deseada es P(A\B) = 0.9129. 


Ejemplo 2.4 Una planta recibe reguladores de voltaje de dos diferentes proveedo- 
res, 5, y B 2 ; el 75% de los reguladores se compra a 5, y el resto a B 2 . El porcentaje 
de reguladores defectuosos que se reciben de es 8% y el de B } es 10%. Determinar 
la probabilidad de que funcione un regulador de voltaje de acuerdo con las especifi- 
caciones (es decir, el regulador no esta defectuoso). 


Sea A el evento el regulador de voltaje es no defectuoso. Es claro que ningun re¬ 
gulador de voltaje puede ser vendido tanto por B, como por B 2 ; por lo tanto B t y B 2 
son disjuntos. Esto da como resultado 

P(A) = P(A n B x ) + P(A n B 7 ), 

pero 

P(A D B,) = P(B l )P(A\B l ) 

y 

P{A n B 2 ) = P(B 2 )P(A\B 2 ). 

en donde se conocen P(Bi) = 0.75, P(B 2 ) = 0.25, P{A\B X ) = 0.92, y P(A\B 2 ) = 
0.9; sustituyendo 


P(A) = P(B X )P(A\B,) + P(B 2 )P(A\B 2 ) 

= (0.75)(0.92) + (0.25K0.90) = 0.915. 

Notese que en el ejemplo 2.4 se tienen unicamente dos proveedores, B t y B : . En 
general, si existen n altemativas disjuntas B r B 2 ... B a , la probabilidad total de un 
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resultado final, por ejemplo A, estA dada por 

‘ ' n 

P{A) = 5): P(Bj)P{A\Bj). (2.10) 

i- I 


2.7 Eventos estadisticamente independientes 

A1 considerar la probabilidad condicional de algun evento A, dada la ocurrencia de 
otro evento B, siempre se implica que las probabilidades de A y B son de alguna ma- 
nera dependientes entre si. En otras palabras, la informacibn con respecto a la 
ocurrencia de B afectarila probabilidad de/1. Sup6ngaseque la ocurrencia de B no 
tiene ningun efecto sobre la probabilidad de A, en el sentido de que la probabilidad 
condicional P{A\B) es igual a la probabilidad marginal P(A), aun a pesar de que ha- 
ya ocurrido el evento B. Esta situation origina un concepto muy importante que se 
conoce como independencia estadistica. 

Definition 2.15 Sean Ay B dos eventos cualesquiera de un espacio muestral S. Se 
dice que el evento A es estadisticamente independiente del evento B si P(A\B) = P(A). 


Algunas consecuencias de la definicibn 2.15 se convierten en evidentes en este 
momento, dado que 


P(A\B) = 


P(A n B) 
P(B) 


si A es independiente de B, 


o 


Ademas, puesto que 


P{A\B) = P(A) = 


P(A n B) 
P(B) 


P(A D B) = P(A)P(B). 


P(A n B) = P(A)P(B\A), 

entonces 

P(A)P(B) = P{A)P(B\A) 
o 

. P(B) = P(B\A). 

Por lo tanto, puede concluirse que si un evento A es estadisticamente independiente 
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de B, entonces el evento B es independiente tie A y se verifican las tres relacionessi- 
guientes: ■ - 



2. P{B\A) = P(B), y 
‘ 3. P(A DB) = P(A)P(B). 

Con la siguiente definicion se extender!! el concepto de independencia estadistica. 

Definiddn 2.16 Los eventos A lt A 2 .../l t deunespacio muestral S son estadistica- 
mente independientes si y solo si la probabilidad conjunta de cualquier 2, 3 ... k de 
ellos es igual al producto de sus respectivas probabilidades marginales. 

De uta manera, los eventos A, By C son estadisticamente independientes, si y 
solo si 

1. P(A D B) = P(A)P{B), 

2. P{A n C) = P(A)P(C), 

3. P(B n C) = P(B)P(C), y 

' 4. P(A n B n C) = P(A)P(B)P(C) 

Ejemplo 2.5 Un sistema contiene cinco componentes que se encuentran conectadas 
entre si como se muestra en la figura 2.2, donde las probabilidades indican la seguri- 
dad de que la componente funcione adecuadamente. Si se supone que el funciona- 
miento de una componente en particular es independiente del de las dem&s, <,cual es 
la probabilidad de que el sistema trabaje? 


P(B) = 0.90 P(D) = 0.93 



FIGURA 2.2 Configuracion de un sistema con cinco componentes 
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Establecida la suposici6n de independencia, el sistema puede trabajar si lascont? 
ponentes A yBy/o C, y D y/o i? lo hacen. De esta manera, laprobabilidaddequeel 
sistema trabaje, P(F), puede expresarse como , .nn %■. on m 

. P{F) = P{A)P(B U C)P(D U ,; n 

pero nbtese q\xe P(B U C) - 1 - P(B)P(C ) y P(D U E) = 1 - P@)P(E), '!- 
porque, por ejemplo P(B)P(C) es la probabilidad de que no trabaje la componente 
B y tampoco la C. Por lo tanto, 

P(F) = (0.98)(0.995)(0.9979) = 0.973 


2.8 £1 teorema de Bayes 

Recuerdese el ejemplo 2.4. Supongase que cuando se reciben los reguladores de vol- 
taje se almacenan de manera tai que no puede distinguirse el proveedor. Adem&s, su¬ 
pongase que se desea determinar la probabilidad de que un regulador en particular 
fue vendido por el proveedor B 2 cuando se sabe que funciona de acuerdo con las es- 
pecificaciones. En este caso se busca la probabilidad condicional de B 2 dada la 
ocurrencia del evento A. Por lo tanto 


pero 


P(B 2 \A) = 


P(B 2 n A) 
P(A) 


P(B 2 DA) = P(B 2 )P{A\B 2 ) 


y 


asi que, 


P{B 2 \A) = 


P(B 2 )P(A\B 2 ) 

P(A) 


P(B 2 \A) = 


(0.25X0.9) 

0.915 


0.2459. 


Se puede generalizar el metodo empleado para resolver este problema, con el fin 
de originar el teorema de Bayes. 

Teorema 2.4 Si B x , B 2 , .... B n son n eventos mutuamente excluyentes, de los 
cuales uno debe ocurrir, es decir S"_, P(B ; ) = 1, entonces 


... 

S P(B,)P(A\B,) 


( 2 . 11 ) 


La expresion dada por (2.11) fue desarrollada por el reverendo Thomas Bayes 
(1702-1761) y se conoce como teorema de Bayes. A primera vista no es mas que 
una aplicacion de las probabilidades condicionales. Sin embargo, ha sido clave en el 
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desarrollo de la inferencia estadistica bayesiana en la, que se emplea la interpreta- 
ci6n subjetiva de la probabilidad. Tal como se indic6 en el capitulo uno, la inferen¬ 
cia bayesiana no se tratarA con detalle en este libro, Sin embargo, se^cqnsiderar&n 
algunas cuestiones bayesianas de vez en cuando, de manera que el lector pueda obte- 
ner una mejor perspectiva de la inferencia estadistica. Los siguientes son ejemplos del 
an&lisis bayesiano. , ; 

Supongase que un investigador conduce un experimento en el que sabe que el re- 
sultado de interes estari afectado por cualquiera de las n altemativas B x , B 2 ... B n 
que predomine. A pesar de que no est& seguro cu41 de todas las altemativas predo- 
minar4, posee cierta information con base en la cual est& dispuesto a formular un 
juicio subjetivo para las probabilidades de ocurrencia de las n altemativas. De esta 
forma, asigna probabilidades P(B X ), P(B 2 )... PfBJ para las n altemativas antes de 
obtener cualquier evidencia experimental. Dado que estas probabilidades reflejan el 
juicio o graao de creencia del investigador con respecto a las ocurrencias de B v B 2 ... 
B m , antes de que estas se presenten se conocen como pro t 'ib ;,i dades a priori. Con 
ello el investigador obtendri una evidencia experimental a partir de un conjunto de 
datos que se denota por A, y se observa bajo una alternativa especifica B r En este 
momento se pueden calcular las probabilidades condicionales P(A\B I ). Estas permi- 
tir&n la determination de la probabilidad B t dada la evidencia experimental A , me- 
diante el empleo del teorema de Bayes. Las probabilidades condicionales P(Bj\A), j 

- 1, 2. n se conocen como probabilidades a posteriori porque se determinan 

una vez obtenida la evidencia experimental. Por lo tanto, las probabilidades P(B\A) 
reflejan el grado de creencia corregido con respecto a las altemativas B t , B 2 , ... B n 
despues de obtener los datos experimentales. 

Ejemplo 2.6 Durante los ultimos aflos se ha escrito mucho sobre la posible rela- 
ci6n entre el fumar y el cancer pulmonar. Supongase que en un centro medico, de to- 
dos los fumadores de quienes se sospecha que tenian cancer pulmonar, el 90% lo tenia 
mientras que unicamente el 5% de los no fumadores lo padecia. Si la proporcion de 
fumadores es de 0.45, £cual es la probabilidad de que un paciente con cdncer pulmo¬ 
nar, seleccionado al azar, sea fumador? 


Sean B | y B 2 los eventos “el paciente es fumador” y “el paciente es no fumador” 
respectivamente, y sea A el evento “el paciente tiene cincer pulmonar”. B , y B 2 son 
las altemativas que pueden predominar. Se supone que las probabilidades a priori, 
para estas dos altemativas, son 0.45 y 0.55 respectivamente. Si un paciente tiene o 
no dincer pulmonar puede estar afectado por cualquiera de las dos altemativas que 
predominen y que constituyen la evidencia experimental. Se sabe que P(A\B t ) = 0.9 
y P(A\B 2 ) = 0.05. Se desea determinar la probabilidad a posteriori de selec- 
cionar un fumador, puesto que el paciente tiene cancer, o P(B t \A). 

Del teorema de Bayes se tiene 


P(B,\A) 


P(B t )P(A\B,) 

P(B,)P(A\B t ) + P(B : )P(A\B 2 ) 


= (0.45)(0.9) 

~ (0.45)(0.9) + (0.55K0.05) 

= 0.9364. 
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La probabilidad de que un paciente con dincer pulmonar, seleccionado aleato- 
riamente sea fumador, es de 0.9364. " 

■. ... ‘ib <13*Oibi5ia!'n 

Ejemplo 2.7, Una compaflia estudia la comercializacibn de un nuevo producto. 
El presidente de la compaflia desea que el producto sea superior al de su mbs cercano 
competidor. Con base en una evaluacibn pre liminar que realiz6 el personal clave, se 
decide asignar una posibilidad del 50% de que e^ producto sea superior al ofrecido 
por el competidor, 30% de que tenga la misma calidad y un 20% de que sea inferior. 
Un estudio de mercado sobre el producto concluye que 6ste es superior al del compe¬ 
tidor. Con base en la experiencia sobre los resultados de las encuestas, se determina 
que si el producto realmente es superior, la probabilidad de que la encuesta alcance 
la misma conclusibn es 0.7. Si el producto tiene la misma calidad que el del competi¬ 
dor, la probabilidad de que la encuesta de como resultado un producto superior es 
0.4. Si el producto es inferior, la probabilidad de que la encuesta indique un produc¬ 
to superior es de 0.2. Dado el resultado de la encuesta, £cubl es la probabilidad, 
corregida, de obtener un producto superior? 

Este es un ejemplo en el que ilustra como una organization puede actualizar y re- 
visar las probabilidades iniciales al tener disponible nueva informacibn. Sean B,, B 2 
y B 3 los eventos el producto es superior, tiene la misma calidad y es inferior al del 
competidor, respectivamente. Las probabilidades a priori correspondientes son 0.5, 
0.3 y 0.2. Sea/l el evento “la encuesta revelar4 un producto superior”. Las proba¬ 
bilidades condicionales que involucran una evidencia experimental son P(A\B t ) = - 
0.7, P{A\B 2 ) = 0.4 y P(A\B i ) = 0.2. La probabilidad a posteriori desea- 

da es: 


P(5,|A) 


_ PjBQPjAfa) _ 

P(B,)P(A\B X ) + P(B 2 )P(A\B 2 ) + P(B,)P(A\B,) 

0.6863. 


2.9 Permutaciones y combinaciones 

Para calcular las probabilidades de varios eventos es necesario contar el numero de 
resultados posibles de un experimento, o contar el numero de resultados que son fa- 
vorables a un evento dado. El proceso de conteo puede simplificarse mediante el 
empleo de dos tecnicas de conteo denominadas permutaciones y combinaciones. 

Una permutacion es un arreglo en un orden particular, de los objetos que forman 
un conjunto. Por ejemplo, considere las diferentes formas en que pueden situarse las 
letras a, by c. Para la primera posicion puede elegirse a cualquiera de las tres letras; 
para la segunda se puede escoger a cualquiera de las dos restantes y para la tercera 
debe seleccionarse la letra que no se utilizo. Asi existen 3 X 2 x 1 = 6 maneras en las 
que pueden arreglarse tres letras. Los seis arreglos o permutaciones son: 

abc, acb, bac, bca, cab, cba. 

www. FreeLibros. com 


46 Conceptos er probabilidad 


empleando el mismo razonamiento, el numero total de maneras en que pueden 
arreglarse las letras a, b, cyrfes4x3x2x 1 = 24. En general, el numero de per- 
mutaciones de n objetos diferentes es: 

n(n — l)(/i — 2) ••• (2)(1). (2.12) 

El producto de un eritero positivo por todos los que le preceden se denota por n! 
y see lee “n factorial”. Por ejemplo, 2! = 2 x 1 = 2, 3! = 3 x 2 x 1 = 6, 4! = 4 
x 3 x 2 x 1 = 24, etc. N6tese que de (2.12) se tiene: 


n(n - 1)! = n\ 


o 

(n - 1)! = n\/n. 

De esta manera, cuando n = 1, se define a 0! = 1. 

En este punto se examinaran las permutaciones de n objetos, si unicamente r *£ n 
de estos se emplean en cualquier ordenamiento. Igualmente, para la primera posi¬ 
tion se puede seleccionar cualquiera de los n objetos, para la segunda uno de los res- 
tantes n - 1, y se continua el procedimiento hasta la r-esima posicidn. En este 
momento se han empleado r - 1 objetos, quedando n-(r- 1), a partir de los cuales 
se hace la seleccidn. Por lo tanto, el numero de permutaciones de n objetos si se toma 
ralaVezes: 

P(n, r)* = n(n - l)(n - 2) ••• (n - r + 1) 

_ ~ 0(ti ~ 2) ••• (n - r + l)(n - r)! 

(n - r)\ 

n\ 

~ (n — r)[' (2.13) 

Notese que si r = n, (2.13) se reduce al resultado anterior P{n, n) = n\, o el numero 
de permutaciones de n objetos, tomando n a la vez, es n!. 

Ejemplo 2.8 En muchos Estados de la Union Americana, las placas de los automd- 
viles, se identifican por tres letras y tres numeros. ^Cudl es el numero total si ningu- 
na letra de placas posible puede usarse mas de una ocasion en la misma placa? <,Cu41 
es el numero total sin esta restriction? 


Con la restriction, el numero de permutaciones que puede obtenerse con las 26 
letras del alfabeto, tomadas tres a la vez, es: 


26! = 26X25 x 24 x 23! 
1 ’ ] 23! 23! 


15 600. 


* Esta es una de las muchas formas de denotar el ndmero de permutaciones de n objetos tomando r a la 
vez. Otros simbolos empleados son „P,, PI, P H , y (n),. 
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Dado que a cada uno de los 15 600 arreglos de tres letras se les puede asignar 1 000 
diferentes numeros de tres dlgitos (000-999), el numero total de placas es de 
15 600 000. Sin la restricci6n, que es la pr&ctica usual, las seis posiciones en una 
placa de automdvil pueden ocuparse de la siguiente forma: cada una de las tres pri- 
meras posiciones puede ocuparse de 26 maneras diferentes, mientras que cada una 
de las tres posiciones restantes puede ocuparse en una de diez formas posibles; dado 
que existen 26 letras y diez ndmeros, respectivamente. De esta man era el ndmero to¬ 
tal de placas de automdvil es 26 x 26 x 26 x 10 x 10 x 10 = 17 576 000. 

Una combinacidn de los objetos de un conjunto es una selecddn de estos sin im- 
portar el orden. Se entenderA por el numero de combinaciones de r objetos tornados 
de un conjunto que contiene a n ds estos, al numero total de selecciones distintas en 
las que cada una de festas contiene r objetos. La diferencia entre una permutaddn y 
una combinacidn es que en la primera el interfes se centra en contar todas las po¬ 
sibles selecciones y todos los arreglos de fcstas, mientras que en la segunda el interes 
solo recae en contar ci numero de selecciones diferentes. De esta manera abc y acd 
on diferentes combinaciones de tres letras, mientras que acd y adc son distintas per¬ 
mutaciones de la misma combinacidn. Puede obtenerse el numero de combinaciones 
de n objetos tomando r a la vez (denotada por (") y que se lee “n combinacidn r”), 
dividiendo el correspondiente numero de permutaciones por r! dado que en cada 
combinacidn existen r! permutaciones. Por lo tanto: 



P(n, r)/r\ 


- al 

(n - r)\ r\' 

De (2.14) puede notarse que: 

M = — al — = 

\nj (n -n)\nl 


M =—ml _= i- 

V0/ (n - 0)! 0! 


( n ) =_ ml _ 

\n - 1/ [n-(/i- !)]!(« - 1)! 


(2.14) 


n\ 


\n - rj [ n - ( n _ - r )! \r 

Dos ejemplos espedficos son: 

< 5 \ 5! 5x4x3! 


(5 - 2)! 2! 


3 ! 2 ! 


= 10 , 


• Otros simbolos comurunente empleados para denotar el numero de combinaciones de n objetos, toman¬ 
do r a la vez, son C(rt,r), „C,, C", y C„ 
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y ■ . ' .. * 

/10\ _ / loY _ 1 10! = 10 X 9 X 8! _ 

\ 8 / \2/ (10 - 2)! 2! 8!2! 

Ejemplo 2.9 Sup6ngase que van a enviarse cinco jueces federales a cierto Estado. 
El jefe del senado estatal envia ai presidente una lista que contiene los nombres de 
diez hombres y cuatro mujeres. Si el presidente decide que de los cinco jueces tres de- 
ben ser hombres y dos mujeres £de cu&ntas maneras puede lograrse lo anterior, 
empleando a los candidatos de la lista? 


El numero de maneras distintas en que pueden seleccionarse tres hombres de 
entre diez es: 


/I0\ _ 10 x 9 x 8 x 7! 
\ 3 / " 7! 3! 


Asimismo, el mimero de maneras en que pueden seleccionarse dos mujeres de entre 
cuatro es: 

( a \ _ 4x3x2! 

\2y 2! 2! 

Puesto que el numero de maneras en que pueden seleccionarse tres hombres de entre 
diez es 120, y el de dos mujeres de entre cuatro es seis, el numero de maneras en que 
ambos eventos pueden ocurrir es: 




= 720. 


Referencias 

1. P. G. Hoel, Introduction to mathematical statistics, 4th ed., Wiley. New York, 1971. 

2. A. M. Mood and F. A. Graybill, Introduction to the theory of statistics, 2nd ed., McGraw- 
Hill, New York, 1963. 


Ejercicios 

2.1. Los empleados de la compaftia New Horizons se encuentran separados en tres divi- 
siones: administracion, operacion de planta y ventas. La siguiente tabla indica el nume¬ 
ro de empleados en cada division clasificados por sexo: 



Mujer (M) 

Hombre (H) 

Totales 

Administracion (A) 

20 

30 

50 

Operacion de planta (O) 

60 

140 

200 

Ventas (k) 

too 

50 

150 

Totales 

180 

220 

400 
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a) Usar un diagrama de Venn para ilustrar los eventos O y M para todos los empleados 
de la compafiia. iSon mutuamente excluyentes? 

b) Si se elige aleatoriamente un empleado: , ■ >■■■'■- ■ •• 

1. iCuil es la probabilidad de que sea mujer? 

2. iCual es la probabilidd de que trabaje en ventas? 

3. iCu&l es la probabilidad de que sea hombre y trabaje en la division de adminis- 

tradbn? \ 

4. iCuil es la probabilidad de que trabaje en la division de operacibn de planta, si es 
mujer? 

5. iCuiil es la probabilidad de que sea mujer si trabaja en la division de operation de 
planta? 

c) iSon los eventos Vy H estadisticamente independientes? 

d) i Son los eventos Ay M estadisticamente independientes? 

e) Determinar las siguientes probabilidades: 

1. P(A U M) 3. P{0 n F) 

2. P(A U M) 4. P(MjA) 

2.2. Con la definicibn 2.14 demuestrese que para cualesquiera dos eventos, A y B. P(A\B) + 
P(A\B) = I, con tal de que P{B) f 0. 

2.3. Sean Ay B dos eventos cualquiera de S. Si A y B son mutuamente excluyentes, muestre- 
se que no pueden ser independientes. Deduzcase cu4ndo dos eventos independientes 
son, tambien, mutuamente excluyentes. 

2.4. Sean Ay B dos eventos cualquiera de S. Empleese un diagrama de Venn para demos- 
trar que P(A fl B) = P(A) - P(A Pi B). 

2.5. Una familia tiene tres hijos. Determinar todas las posibles permutaciones, con respecto 
al sexo de los hijos. Bajo suposiciones adecuadas, icual es la probabilidad de que, cxac- 
tamente, dos de los hijos tengan el mismo sexo?, £cu&l es la probabilidad de tener un va- 
ron y dos mujeres?, £cual es la probabilidad de tener tres hijos del mismo sexo? 

2.6. Se extraen, sin reemplazo, dos cartas de una baraja. iCual es la probabilidad de que am- 
bas sean ases? 

2.7. Se lanza una moneda diez veces y en todos los lanzamientos el resultado es cara. iC'ual 
es la probabilidad de este evento?, icual es la probabilidad de que en el decimoprimero 
lanzamiento el resultado sea cruz? 

2.8. Una agenda automotriz recibe un embarque de 20 automoviles nuevos. Entre estos, dos 
tienen defectos. La agencia decide seleccionar, aleatoriamente, dos automdviles de entre 
los 20 y aceptar el embarque si ninguno de los dos vehlculos seleccionados tiene defec¬ 
tos. iCual es la probabilidad de aceptar el embarque? 

2.9. Se lanza una moneda con una probabilidad de 2/3 que el resultado sea cara. Si apare- 
ce una cara, se extrae una pelota, aleatoriamente, de una urna que contiene dos pelotas 
rojas y tres verdes. Si el resultado es cruz se extrae una pelota, de otra urna, que con¬ 
tiene dos rojas y dos verdes. iCutd es la probabilidad de extraer una pelota roja? 

.10. De entre 20 tanques de combustible fabricados para el transbordador espacial, tres se 
encuentran defectuosos. Si se seleccionan aleatoriamente cuatro tanques: 

a) iCual es la probabilidad de que ninguno de los tanques se encuentre defectuoso? 

b) iCual es la probabilidad de que uno de los tanques tenga defectos? 
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2.11. La probabilidad de que cierto componente electrico funcione es de 0.9. Un aparato con- 

tiene dos de estos componentes. El aparato funcionari mientras lo haga, por lo menos, 
uno de los componentes. - ; 

a) Sin importar cual de los dos componentes funcione o no, icu&les son los posibles re- 
sultados y sus respectivas probabilidades? (Puede suponerse independiencia en la opera- 
cion entre los componentes.) 

b) iCual es la probabilidad de que el aparato funcione? 

2.12. Un sistema contiene tres componentes A, By C. festos pueden conectarse en una, cual- 
quiera, de las cuatro configuraciones mostradas en la figura 2.3. Si los tres componentes 
operan de manera independiente y si la probabilidad de que uno, cualquiera de ellos, 
este funcionando es de 0.95, determinar la probabilidad de que el sistema funcione para 
cada una de las cuatro configuraciones. 

2.13. Una forma de incrementar la probabilidad de operacion de un sistema (conocida como 
la confiabilidad del sistema), es mediante la introduccibn de una copia de los compo¬ 
nentes en una configuration paralela, como se ilustra en la segunda parte de la figura 
2.3. Supongase que la Nasa desea una probabilidad no menor de 0.999 99, de que el 
transbordador espacial entre en orbita alrededor de la tierra, con exito. iCuantos moto- 
res cohere deben configurarse en paralelo para alcanzar esta confiabilidad de operacion 
si se sabe que la probabilidad de que uno, cualquiera, de los motores funcione ade- 
cuadamente es de 0.95? Supongase que los motores funcionan de manera independiente 
entre si. 
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2.14. Supbngase que la probabilidad de que los Potros de Baltimore ganen el campeonato de 
la Cbnferencia Americana es de 0.25, y la probabilidad de que lo obtengan los Cargado- 
res de San Diego es de 0.20. Adem&s, la probabilidad de que el campedn de la Conferen¬ 
ce Americana gane el Super Taz6n es 0.45, 0.55 o 0.35, dependiendo de si los Potros, 
los Cargadores o algun otro equipo gana el campeonato. 

\ 

a) iCual es la probabilidad de que un equipo de la Conference Americana gane el Su¬ 
per Taz6n? 

b) Si un equipo de la Conference Americana gana el Super Taz6n, £cu&l es la probabi¬ 
lidad de que los Potros de Baltimore ganen el titulo de su Conference? 

2.15. El 5% de las unidades producidas en una f&brica se encuentfan defectuosas cuando el 
proceso de fabrication se encuentra bajo control. Si el proceso se encuentra fuera de 
control, se produce un 30% de unidades defectuosas. La probabilidad marginal de que el 
proceso se encuentre bajo control es de 0.92. Si se escoge aleatoriamente una unidad y se 
encuentra que es defectuosa, £cuid es la probabilidad de que el proceso se encuentre 
bajo control? 

2.16. Una planta armadora reribe microcircuitos provenientes de tres distintos fabricantes fl,, 
B 2 y Bj. El 50% del total se compra a B, mientras que a B 2 y By se les compra un 25% a 
cada uno. El porcentaje de circuitos defectuosos para/?,, B, y B, es5,10 y 12% respec- 
tivamente. Si los circuitos se almacenan en la planta sin importar quien fue el proveedor: 

a) Determinar la probabilidad de que una unidad armada en la planta contenga un cir- 
cuito defectuoso. 

b) Si un circuito no esta defectuoso, £cual es la probabilidad de que haya sido vendido 
por el proveedor B 2 ? 

2.17. Un inversionista estii pensando en comprar un numero muy grande de acciones de una 
compaftia. La cotizacidn de las acciones en la bolsa, durante los seis meses anteriores, es 
de gran interes para el inversionista. Con base en esta information, se observa que la 
cotization se relaciona con el producto national bruto. Si el PNB aumenta, la probabili¬ 
dad de que el valor de las acciones aumente es de 0.8. Si el PNB es el mismo, la probabi¬ 
lidad de que las acciones aumenten su valor es de 0.2. Si el PNB disminuye, la probabilidad 
es de solo 0.1. Si para los siguientes seis meses se asignan las probabilidades 0.4, 0.3 
y 0.3 a los eventos, el PNB aumenta, es el mismo y disminuye, respectivamente, deter¬ 
minar la probabilidad de que las acciones aumenten su valor en los proximos seis meses. 

2.18. Con base en varios estudios una compaftia ha clasificado, de acuerdo con la posibilidad 
de descubrir petroleo, las formationes geologicas en tres tipos. La compaftia pretende 
perforar un pozo en un determinado sitio, al que se le asignan las probabilidades de 
0.35, 0.40 y 0.25 para los tres tipos de formationes respectivamente. De acuerdo con la 
experiencia, se sabe que el petroleo se encuentra en un 40% de formationes del tipo I, en 
un 20% de formationes del tipo II y en un 30% de formationes del tipo III. Si la 
compaftia no descubre petroleo en ese lugar, determinese la probabilidad de que exista 
una formation del tipo II. 
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CAPITULO TRES 

Variables aleatorias y 
distribuciones de probabilidad 


3.1 £1 concepto de variable aleatoria 

En el capitulo dos se examinaron los conceptos basicos de probabilidad con respecto 
a eventos que se encuentran en un espacio muestral. Los experimentos se conciben 
de manera que los resultados del espacio muestral son cualitativos o cuantitativos. 
Como ejemplos de resultados cualitativos se tienen: a) el lanzamiento de una mone- 
da es “cara” o “cruz”; b) un producto manufacturado en una fabrica puede ser 
“defectuoso” o “no defectuoso”, o c) una persona en particular puede preferir la 
locion X sobre la locion Y. Puede ser util la cuantificacion de los resultados cualita¬ 
tivos de un espacio muestral y, mediante el empleo de medidas numericas, estudiar 
su comportamiento aleatorio. El concepto de variable aleatoria proporciona un me¬ 
dio para relacionar cualquier resultado con una medida cuantitativa. 

Definition 3.1 Sea S un espacio muestral sobre el que se encuentra definida una 
funcion de probabilidad. Sea X una funcion de valor real definida sobre S, de mane¬ 
ra que transforme los resultados de S en puntos sobre la recta de los reales. Se dice 
entonces que X es una variable aleatoria. 

Se dice que X es “aleatoria” porque involucra la probabilidad de los resultados 
del espacio muestral, y X es una funcidn definida sobre el espacio muestral, de ma¬ 
nera que transforma todos los posibles resultados del espacio muestral en cantidades 
numericas. 

Par ilustrar la notion de variable aleatoria, considerese el lanzamiento de una 
moneda. El espacio muestral esta constituido por dos posibles resultados, “cara” y 
“cruz”. Sea A'Ccruz) = 0 y A"(cara) = 1; de esta manera se han transformado los 
dos posibles resultados del espacio muestral en puntos sobre la recta de los reales. 
Por P(X = 0) se entendera la probabilidad de que la variable aleatoria tome el 
valor cero o, de manera equivalente, la probabilidad de que caiga cruz cuando se 
lance la moneda. Como ejernplo adicional, considerese el lanzamiento de dos dados 
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indistinguibles y los 36 posibles resultados, como se muestra en la tabla 2.1. Se defi¬ 
ne como variable aleatoria A - a la suma de los valores de las dos caras de los dados. 
La tabla 3.1 relaciona los 36 resultados con los valores correspondientes de la va¬ 
riable aleatoria X y sus probabilidades. La naturaleza probabUistka de la variable 
aleatoria X, la suma de las dos caras, puede observarse el graficar cada valor de X 
contra su probabilidad como se muestra en la, figura 3.1. 

Para cada uno de los ejemplos anteriores, elnumero de posibles valores de la va¬ 
riable aleatoria es finito. Sin embargo, se pueden definir variables aleatorias cuyos 
valores- sean contables o no. Ya que una variable aleatoria es una caracterizacibn 
cuantitativa de los resultados de un espacio muestral, esta posee intrinsecamente la 
naturaleza discreta o continua de este espacio. 

Definicibn 3.2 Se dice que una variable aleatoria X es discreta si el numero de valo¬ 
res que puede tomar es contable (ya sea finito o infinito), y si fcstos pueden arreglarse 
en una secuencia que corrcspcide con los enteros positivos. 

Definicibn 3.3 Se dice que una variable aleatoria X es continua si sus valores con- 
sisten en uno o mbs intervalos de la recta de los reales. 

3.2 Distribuciones de probabilidad de variables aleatorias discretas 

En esta seccibn se considerarb el concepto de distribucibn de probabilidad de una va¬ 
riable aleatoria. En la figura 3.1 se muestra la grbfica de los valores correspondientes 
a la variable aleatoria que respresenta la suma de las caras de los dos dados, cuando 
bstos se tiran. En general, una variable aleatoria discreta X representa los resultados 
de un espacio muestral en forma tal que por PfX = x) se entenderb la probabilidad 
de que X tome el valor de x. De esta forma, al considerar los valores de una variable 
aleatoria es posible desarrollar una funcion matembtica que asigne una probabilidad 
a cada realizacidn x de la variable aleatoria X. Esta funcibn recibe el nombre de fun- 


TABLA 3.1 Correspondencia entre los resultados del lanzamiento de un par de dados y la 
variable aleatoria que representa la suma de las caras 


Resultado 

Valor de la 
variable aleatoria 

Numero de 
ocurrencias 

Probabilidad 

(U) 

2 

i 

1/36 

(1,2), (2,1) 

3 

2 

2/36 

(1,3), (2,2), (3,1) 

4 

3 

3/36 

(1,4), (2,3), (3,2), (4.1) 

5 

4 

4/36 

(1,5), (2,4), (3,3), (4,2), (5,1) 

6 

5 

5/36 

(1,6), (2,5), (3,4), (4,3), (5,2), (6,1) 

7 

6 

6/36 

(2,6), (3,5), (4,4), (5,3), (6,2) 

8 

5 

5/36 

(3,6), (4,5), (5,4), (6,3) 

9 

4 

4/36 

(4,6), (5,5), (6,4) 

10 

3 

3/36 

(5,6), (6,5) 

11 

2 

2/36 

(6,6) 

12 

1 

1/36 


www. FreeLibros. com 




54 Variables aleatorias y distribuciones de probabilidad 



FIGURA 3.1 Probabilidad para las sumas de las caras de dos dados 

cidn de probabilidad* de la variable aleatoria X. El termino mas general, distri- 
bucidn de probabilidad, se refiere a la coleccibn de valores de la variable aleatoria y 
a la distribucibn de probabilidades entre estos. Sin embargo, hacer referencia a la 
distribucibn de probabilidad de X no sblo implica la existencia de la funcibn de pro¬ 
babilidad, sino tambien la existencia de la funcidn de distribucibn acumulativa 
deX. 

Definicion 3.4 Sea X una variable aleatoria discreta. Se Uamara a p(x) = P(X = x) 
funcibn de probabilidad de la variable aleatoria X, si satisface las siguientes pro- 
piedades: 

1. p(x) 2* 0 para todos los valores x de X; 

2. X, p(x) = 1. 

Definicion 3.5 La funcibn de distribucion acumulativa de la variable aleatoria X 
es la probabilidad de que X sea menor o igual a un valor especifico dex y estb dada 
por: 

Fix) = P(X ^ x) = X PU,). 

X i^X 

* El nombre completo de esta funcibn es el de funcidn mdsiea de probabilidad de una variable aleatoria 
discreta. 
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Por lo tanto, en el caso discreto, una variable aleatoria A estb caracterizada por 
la funcibn de probabilidad puntual p(x), la cual determina la probabilidad puntual 
de que X - x, y por la funcibn de distribucibn acumulativa F(x), la que representa la 
suma de las probabilidades puntuales hasta el valor x de A inclusive. N6tese que las 
definiciones anteriores son consistentes con los axiomas de probabilidad, ya que esta 
funci6n no es negativa para cualquier valor de la variable aleatoria y la suma de las 
probabilidades para todos los valores de A - es igual a uno. 


Ejemplo 3.1 Consid6rese de nuevo el lanzamiento de dos dados. Si Aes la variable 
aleatoria que representa la suma de las caras, la funcibn de probabilidad de A es 


p(x) = 


6 - 17 - x\ 


36 


x = 2, 3, ..., 12, 
para cualquier otro valor 


(3.1) 


Con (3.1), pueden determinarse las probabilidades para varios valores de A con- 
tenidos en la tabla 3.1 y cuya grafica se muestra en la figura 3.1. Ademas, puede eva¬ 
luate la funcibn de distribucibn acumulativa de A de la siguiente forma: 


Notese que: 

P(X > 7) 


F (1) = P{ A « 1) = 0 

F (2) ■ P(X 2) = 1/36 

F (3) ■ P( X *£ 3) = 3/36 

F (4) = P{X *= 4) = 6/36 

F (5) a P{X « 5) = 10/36 

F (6) ^ P{X « 6) = 15/36 

F (7) = P{X 7) = 21/36 

F (8) = P(X « 8) = 26/36 

F (9) = P(X 9) = 30/36 

F(I0) = P( X =£ 10) = 33/36 
F(ll) - P(X *£ 11) = 35/36 
F(12) = P(X « 12) = 1. 


P(X^ 7) = 1 - F(7) = 15/36; 


P( X = 7) = P( X « 7) - P( X ^ 6) = F(7) - F( 6) = 6/36; 

P(5 =£ A =£ 9) = P( X « 9) - P( X *£ 4) = F( 9) - F(4) = 24/36. 
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En general, la funci6n de distribuci6n acumulativa F\x) de una variable aleatoria 
discreta es una funcibn no decreciente de los valores de X, de tal manera que 

1. 0 =£ F(x) =£ 1 para cualquier x; 

2. F(Xi) » F(xj) si x, > xf, 

3. P(X > x) = 1 - F(x). 

Ademas, puede establecerse que para variables aleatorias de valor entero se tiene que: 

4. P(X = x) = F(x) - F(x - 1); 

5. P(x, Xj) = F(xj) - F(Xj - 1). 

La grafica de la distribucion acumulativa del ejemplo 3.1 se muestra en la figura 
3.2. En esta figura es evidente que la funcibn de distribucibn acumulativa de una va¬ 
riable aleatoria discreta es una funcibn escalbn, que toma un valor superior en cada 
salto. 



FIGURA 3.2 'Representancion grafica de la funcibn de distribucibn acumulativa de la suma 
de las caras de dos dados, cuando estos se lanzan 


www. FreeLibros. com 




3.3 Distribuciones de probabilidad de variables aleatorias continuas 57 

3.3 Distribuciones de probabilidad de variables aleatorias continuas 

En la seccibn anterior se trataron distribuciones de probabilidad para variables alea¬ 
torias discretas. En esta se examinaran conceptos similares para variables aleatorias 
continuas. En el caso discreto, se asignan probabilidades positivas a todos los valo- 
res puntuales de la variable aleatoria, pero la suma de todas ellas es uno aun a pesar 
de que el conjunto de valores sea infinito contable. Para el caso continuo, lo anterior 
no es posible. 

Por esta razbn, la probabilidad de que una variable aleatoria continua X tome un 
valor especifico x es cero. 

Se ilustrara el sentido de este resultado mediante el siguiente ejemplo: supbngase 
que se observa el interval© entre dos llegadas consecutivas a un servicio. Si el disposi- 
tivo de medicibn puede medir el tiempo hasta una decima de segundo, entonces un 
intervalo de 83.4 seg puede realmente tomarse como la media y el verdadero valor 
puede encontrarse entre 83.35 y 83.45 seg. Por lo tanto, en el caso continuo es mis 
16gico visualizar las probabilidades de intervalos que de puntos en particular. 

La distribution de probabilidad de una variable aleatoria continua X esta carac- 
terizada por una funci6n f(x) que recibe el nombre de funcion de densidad deprobu- 
bilidad. Esta funcibn f(x) no es la misma funcibn de probabilidad que para el caso 
discreto. Como existe la probabilidad de que X tome el valor especifico x es cero, la 
funcion de densidad de probabilidad no representa la probabilidad de que X = x. 
Mas bien, esta proporciona un medio para determinar la probabilidad de un interva¬ 
lo a =£ X ^ b. 

Para ilustrar lo que se entiende como funcibn de densidad de probabilidad, su¬ 
pbngase que se miden los tiempos, entre dos llegadas consecutivas, de 100 clientes a 
una tienda y se agrupan en diez intervalos de un minuto cada uno, como se muestra 
en la tabla 3.2. En este punto se grafican las frecuencias relativas para cada intervalo 
por medio de rectangulos, como se muestra en la figura 3.3, para indicar que la fre- 
cuencia se refiere al intervalo completo mas que a un punto en particular del mismo. 
Nbtese que, puesto que la base tiene una longitud igual a uno, el area de cada rectan- 
gulo es la frecuencia relativa del correspondiente intervalo y, por lo tanto, la suma 
de las areas de todos los rectangulos es igual a uno. 


TABLA 3.2 Tiempos entre dos llegadas consecutivas, agrupados, de 100 clientes a un servicio 


Intervalo 

Numero de llegaays 

Frecuencia relativa 

0 < x =£ 1 

22 

0.22 

1 < x =s 2 

18 

0.18 

2 < x « 3 

17 

0.17 

3 < x « 4 

13 

0.13 

4 < x « 5 

14 

0.14 

5 < x 6 

8 

0.08 

6 < x « 7 

6 

0.06 

7 < x =s 8 

7 

0.07 

8 < x s' 9 

3 

0.03 

9 < x s 10 

2 

0.02 
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Supbngase que en lugar de observar los tiempos entre dos llegadas consecutivas 
de 100 clientes, se observan los tiempos para 1 000 clientes y se agrupan en 20 inter- 
valos de medio minuto cada uno; o bien pueden observarse los tiempos para 10 000 
clientes agrup&ndolos en 40 intervalos de 15 segundos cada uno. Cada vez que esto 
se hace, se produce un histograma que es cada vez menos irregular, pero en el que la 
frecuencia sigue siendo pr&cticamente la misma. A1 continuar este proceso de 
aumento del numero de observaciones mientras se disminuye la amplitud de los in¬ 
tervalos de clase, se llegar& a una curva limite. Esto es, cuando el numero observado 
de tiempos, entre dos llegadas consecutivas, sea muy grande y la amplitud de los in¬ 
tervalos de clase sea muy pequefia, la frecuencia relativa aparecer&, en esencia, como 
una curva lisa. Con base en la figura 3.3, puede especularse que la curva limite para 
este ejemplo es la que se muestra en la figura 3.4. 

La funcibn ./(*), cuya gr&fica es la curva limite que se obtiene para un numero 
muy grande de observaciones y para una amplitud de intervalo muy pequefia, es la 
funcibn de densidad de probabilidad para una variable aleatoria continua X, ya que 
la escala vertical se elige de manera que el &rea total bajo la curva es igual a uno. La 
funcibn de densidad de probabilidad de una variable aleatoria continua X se define 
formalmente de la siguiente manera: 

Definicidn 3.6 Si existe una funcibn J[x) tal que 

1 • f(x) >0, - 30 < X < oe, 

2. | f(x)dx = 1, y 

3. P(a « X *£ b) = f f(x)dx 

Ja 



t K.URA 3 3 Frecuencias relativas para los tiempos entre dos llegadas consecutivas, agrupa- 
dos en diez intervalos 
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J7 



FIGURA 3.4 Curva limite para la frecuencia relativa de los tiempos de llegadas 


para cualesquiera a y b, entonces/(x) es la funci6n de densidad de probabilidad de la 
variable aleatoria continua X. 

Puesto que el area total bajo/(x) es uno, la probabilidad del intervalo a *£ X 
b es el area acotada por la funcibn de densidad y las rectas X = a y X = b, como se 
muestra en la figura 3.5. 



FIGURA 3.5 Probabilidad ilustrada como el area bajo la curva de densidad 
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A1 igual que en el caso de una variable aleatoria discreta, la funcibn de distribu- 
ci6n acumulativa de una variable aleatoria continua X es la probabilidad de que X 
tome un valor menor o igual a algun x especifico. Esto es, 

P(X =£ jc) = F(x) = f J{t)dt, (3.2) 

en donde t es una variable artificial de integracibn. Por lo tanto, la funcibn de distri- 
bucibn acumulativa F\x) es el cirea acotada por la funcibn de densidad que se en- 
cuentra a la izquierda de la recta X = x, como se ilustra en la figura 3.6. 

Dado que para cualquier variable aleatoria continua X, 

P(X = x) = £ f(t)dt = 0, 


entonces: 

P(X =Sjc) = P(X < x) = Fix). 

La distribucibn acumulativa F[x), es una funcibn lisa no decreciente de los valo- 
res de la variable aleatoria con las siguientes propiedades: 

1. Fi- oo) = 0; 

2. Fi*) = 1; 

3. Pia < X < b) = Fib) - F(a); 

4. dFix)/dx = fix). 



FIGURA 3.6 La distribuci6n acumulativa, ilustrada como un area bajo la curva de densidad 
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La propiedad de que la derivada de la funcidn de distribucibn acumulativa es la fun- 
ci6n de densidad de probabilidad, es una consecuencia del teorema fundamental del 
c&lculo integral. 

Ejemplo 3.2 La variable aleatoria X representa el intervalo de tiempo entre dos lle- 
gadas consecutivas a una tienda y su funcibn de densidad de probabilidad est& dada 
por: 

[k exp(-jc/2),* x > 0, 


fix) = 


0 


para cualquier otro valor 


para una constante k apropiada. Determinar el valor de k, la funcibn de distribucibn 
acumulativa, la probabilidad de que 2 < X < 6, y la probabilidad de que X =£ 8. 
Debe insisdrse en que: 


*3C 


fix)dx = 1; 


por lo tanto, dado que en este ejemplo J[x) = 0 si x =£ 0, entonces el valor de k esta 
determinado por: 


/; 


k exp(-jc/2 )dx = I. 


Despues de la integracidn se tiene que: 

-2k exp(-.r/2) 


= L 


y k = 1/2. La funcidn de distribucion acumulativa es: 

Fix) = j J(t)dt 

= j . odi + \ L exp( ~ 

= 1 - exp(-x/2) parax>0, 

yF(x) = Opara x *£ 0. Ademas DF(x)/dx = 1/2 exp(-jr/2), que es lo que se es- 
peraba. 

La probabilidad de que un intervalo entre dos llegadas consecutivas se encuentre 
entre dos y seis minutos es: 

1 f 6 

P(2 < X < 6) = - exp( -x/2)dx = F{ 6) - F(2) 

, = [1 - exp( — 3)] - [1 - exp(-l)] = 0.3181. 

* No se dudar& en emplear “exp" en lugar de “e”, toda vez que esta notacidn sea menos oscura. 
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La probabilidad de que transcurran menos de ocho minutos entre dos llegadas con- 
secutivas es: 

P(X < 8) = F(8) = 1 - exp( - 4) = 0.9817. 

La probabilidad de que estaexceda los ocho minutos esl - F( 8) = exp(-4) = 0.0183. 


Ejemplo 3.3 La variable aleatoria que representa la proporci6n de accidentes 
automovilisticos fatales en Estados Unidos, tiene la siguiente funcibn de densidad: 


fix) = 


f 42x( 1 - x) 5 

10 


0 < x =£ 1 

para cualquier otro valor 


iCucil es la probabilidad de que no m&s del 25% de los accidentes automovilisticos 
sean fatales? En otras palabras, ;,cual es P[X 0.25]? 


La funcibn /(x) es una densidad de probabilidad dado que: 

I 

= 1. 
o 

Notese que cuando la variable aleatoria X es 1/4, la funcibn de densidad es 
1/4) = 2.4917. Deesta forma, en el caso continuo es bastante factible tener, para 
un valor especifico de la variable aleatoria X, un valor de la funcibn de densidad 
mayor que uno aun a pesar de que la integral de la funcibn de distribucibn sobre el 
intervalo completo de valores de la variable aleatoria sea uno. Finalmente, la fun¬ 
cibn de distribucibn acumulativa es: 

F(x) = 42 r(l - ifdt = 21x 2 - 70x 3 + 105x 4 - 84x 5 + 35x 5 - 6x 7 . 

Jo 

Por lo tanto, la probabilidad de que la proporcion de accidentes automovilisticos fa¬ 
tales sea menor del 25% es: 

F{ 1/4) = 21(1 /4) 2 - 70(1/4) 3 + 105(l/4) 4 - 84(1/4/ + 35(1/4/ - 6(1/4) 7 
= 0.5551. 


r 


42 x(l - x)dx = 42 


5x 3 10x 4 

3 + 4 


10x 5 5x 6 

5 + 6 


3.4 Valor esperado de una variable aleatoria 

El valor esperado (o esperanza) de una variable aleatoria es un concepto muy impor- 
tante en el estudio de las distribuciones de probabilidad. La esperanza de una va¬ 
riable aleatoria tiene sus origenes en los juegos de azar, debido a que los apostadores 
deseaban saber cual era su esperanza de ganar repetidamente un juego. En este senti- 
do, el valor esperado representa la cantidad de dinero promedio que el jugador esta 
dispuesto a ganar o perder despues de un numero muy grande de apuestas. Este signi- 


www. FreeLibros. com 



3.4 Valor esperado de una variable aleatoria 63 


ficado tambien es v&lido para una variable aleatoria. Es decir, el valor promedio de 
una variable aleatoria despues de un numero grande de experimentos, es su valor es¬ 
perado. 

Para ilustrar la esencia de la esperanza, se analizarO el siguiente juego de azar. 
Supongase que se tiene moneda normal y el jugador tiene tres oportunidades para 
que al lanzarla aparezca una “cara”. El juego termina en el momento en el que cae 
una “cara” o despues de tres intentos, lo que suceda primero. Si en el primero, segundo 
o tercer lanzamiento aparece “cara” el jugador recibe $2, $4, y $8 respectivamente. 
Si no cae “cara” en ninguno de los tres lanzamientos, pierde $20. Para determinar la 
ganancia o perdida promedio despues de un numero muy grande de juegos, sea X 
la variable aleatoria que representa la cantidad que se gana o se pierde cada vez que 
se juega. Los posibles valores de X junto con sus respectivas probabilidades se en- 
cuentran en la tabla 3.3. Despues de un numero grande de juegos se espera ganar 
$2 en cualesquiera de los dos lanzamientos, $4 en cualesquiera de los cuatro lanza¬ 
mientos, $8 una vez cada ocho lanzamientos y se espera perder $20 una vez en cada 
ocho intentos. El valor esperado, o la cantidad promedio que se ganaria en cada juego 
despues de un numero muy grande de estos, se determina multiplicando cada canti¬ 
dad que se gana o se pierde por su respectiva probabilidad y sumando los resultados. 
De acuerdo con la anterior, la esperanza de ganar es: 

($2)(l/2) + ($4)0/4) + ($8)(l/8) + (- $20)(l/8) = $0.50 

por juego. Notese que el valor esperado de 50 centavos no es ninguno de los posibles 
valores de la variable aleatoria; de esta forma, es completamente posible que una va¬ 
riable aleatoria nunca tome el valor de su esperanza. 

El ejemplo anterior sugiere la siguiente definition de la esperanza matematica de 
una variable aleatoria: 

Definicidn 3.7 El valor esperado de una variable aleatoria X es el promedio o valor 
medio de X y esta dado por: 

si x es discreta, o 


si X, es continua. 

en donde p(x) y fix) son las funciones de probabilidad y de densidad de probabili¬ 
dad, respectivamente. 


TABLA 3.3 Probabilidades de ganar o perder en un juego de azar 


X 


P(X) 

2 

P(X = 2) = 

P(H) = 1/2 

4 

P(X = 4) * 

P(T n H) = 1/4 

8 

P(X = 8) = 

P(T n t n H) = i/8 

-20 

-o 

* 

ii 

l 

to 

© 

s p(T n t n T) = 1/8 


E(X) = ^ xp(x) 

X 

E(X ) = J xf{x)dx 
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En general, el valor esperado de una funcibn g(x) de la variable aleatoria X, est& 
dado por: 


E[g(X)] = 2 g{x)p(x) si x es discreta, o 

X 


E[g(X )] = f_g(x)/(x)dx 


si X, es continua. 


(3.3) 


La esperanza de una variable aleatoria X no es una funcibn de X sino un numero 
fijo y una propiedad de la distribucibn de probabilidad de X. Por otra parte, el valor 
esperado puede no existir dependiendo de si la correspondiente suma o integral no 
converge en un valor finito. 


Ejemplo 3.4 ‘m la variable aleatoria X representa la suma de las caras de dos dados 
cuando festos se lanzan, demostrar que el valor esperado de A - es siete. 


Con la funcibn de probabilidad de X dada por (3.1) y la definicion 3.7, se tiene: 

12 

E(X) = 2 xp(x) = (2)(l/36) + (3)(2/36) + ••• + (12)(l/36) = 7. 

jt = 2 

Ejemplo 3.5 Para el ejemplo 3.3, determinar el valor esperado de la proporcibn de 
accidentes fatales en Estados Unidos. 

Con la definicibn 3.7, el valor esperado de la proporcibn es: 


E(X) = 42 
= 42 


l xf(x)dx 
f x 2 (l - xfdx 

JO 



5x _ 2 5jc 3 

T + 2jr _ T + 


5x 4 

7 



= 0.25. 


Ejemplo 3.6 Supongase que el tiempo necesario para reparar una pieza de equipo, 
en un proceso de manufactura, es una variable aleatoria cuya funcibn de densidad 
de probabilidad es: 


fix) = 


ri 

-exp (-jc/5) 
.0 


jc > 0. 

para cualquier otro valor. 


Si la perdida de dinero es igual al cuadrado del numero de horas necesarias para lle- 
var a cabo la reparacion, se debe determinar el valor esperado de las perdidas por re- 
paracibn. 
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En este caso es necesario calcular el valor esperado de una funci6n que se en- 
cuentra relacionada con la variable aleatoria (el tiempo de reparation). Esta funtiOn 
es: 

Sto = x 2 \ 

por lo tanto: 

E[g{X)] = | g(x)f(x)dx = ^ f o x 2 exp(-x/5 )dx. 

Para evaluar integrales de este tipo en donde el integrando es un producto de una po- 
tencia por una exponential negativa sobre la recta de los reales positivos, es mejor 
emplear la funcion matematica: 

T(n) = J u"~' exp( -u)du, n > 0, (3.4) 

Jo 

que se conoce como funcidn gama del argumento n. Algunas propiedades de esta 
func : 6n son: 


1. T(n + 1) = n\ si n es un entero positivo; 

2. T(n + 1) = «r(n), n > 0; 

3. r(l/2) = V^r- 

De acuerdo con lo anterior, para evaluar la integral 

E{g(X)] = \ [ x 2 exp(-x/5)dx, 

5 Jo 

en (3.4) es u - x/5; en otras palabras, x 5u dx = 5 du. Entonces: 

^l^)] = i | x 2 exp(-x/5)dx = ^ f (5w) 2 exp(- u)5du 
5 Jo 5 Jo 



= 25H3) 
= 50, 


50 es el valor esperado de la perdida por reparation. 


Ejemplo 3.7 Un inversionista dispone de $100 000.00 para una inversion de un 
aflo. El inversionista esta considerando dos opciones: colocar el dinero en el merca- 
do de valores, lo que le garantiza una ganancia anual fija del 15% y un plan de inver¬ 
sion cuya ganancia anual puede considerarse como una variable aleatoria cuyos 
valores dependen de las condiciones econOmicas que prevalezcan. Con base en la. 
historia pasada del segundo plan, un analista muy confiable ha determinado los po- 
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sibles valores de la ganancia y calculado sus probabilidades, como se muestra en la 
tabla 3.4. Con base en la ganancia esperada <,cu(d de los dos planes debe selecdonarse? 

Si se escoge el primer plan, colocar el dinero en el mercado de valores, la ganan¬ 
cia anuai que producen $100 mil serii de $15 mil, dado que esta es fija y su valor es 
del 15%. Para el segundo plan, sea A" la variable aleatoria que representa la ganan¬ 
cia. Con la definition 3.7, se tiene: 

E(X) = (0.3)(0.2) + (0.25X0.2) + - + (0.05X0.05) = 0.205. 

De acuerdo con lo anterior, el segundo plan es una election mucho mejor puesto que 
ofrece una ganancia esperada de $20 500. Sin embargo, el lector debe ser cauteloso 
en este punto, dado que el valor de $20 500 es unicamente un valor esperado y el in- 
versionista no tiene ninguna garantia dc que su ganancia real se encuentre cercana a 
este valor. 

A continuation se enunciarOn y demostrar&n algunas propiedades importantes 
de la esperanza de una variable aleatoria. Se usarO el caso continuo, a pesar de que 
estas propiedades tambien son validas para variables aleatorias discretas. Sea A una 
variable aleatoria continua con una funciOn de densidad de probabilidad./^). 

1. El valor esperado de una constante c es el valor de la constante. 

E(c) = J cf(x)dx = c J f(x)dx = c. 

2. El valor esperado de la cantidad aX + b, en donde ay b son constantes, es el 
producto de a por el valor esperado de x mas b. 

E{aX + b) = j (ax + b)f(x)dx = a J xf(x)dx 4- b J f(x)dx 
= aE( X) + b. 

3. El valor esperado de la suma de dos funciones gfX) y h(X) de A es la suma de los 
valores esperados de g(X) y h(X). 

E(g( A) 4- h( A)] = j Jg(x) + h(x)}f(x)dx 



TABLA 3.4 Valores de la ganancia para el ejemplo 3.7 


Ganancia (%) 

30 

25 

20 

15 

10 

5 


Probabilidad 
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-F 


/: 


g{x)f(x)dx + h(x)f(x)dx 


= E[g{X )] + E[h(X)\. 


3.5 Momentos de una variable aleatoria 

Los momentos de una variable aleatoria X* son los valores esperados de ciertas fun- 
ciones de X. Estos forman una coleccibn de medidas descriptivas que pueden em- 
plearse para caracterizar la distribucidn de probabilidad de X y especificarla si todos 
los momentos de X son conocidos. A pesar de que los momentos de X pueden defi- 
nirse alrededor de cualquier punto de referenda, generalmente se definen alrededor 
del cero o del valor esperado de X. El uso de los momentos de una variable aleatoria 
para caracterizar a la distribucion de probabilidad es una tarea muy util. Lo anterior 
es especialmente cierto en un medio en el que es poco probable que el experimenta- 
dor conozca la distribucidn de probabilidad. Todas las proposiciones con icspecto a 
los momentos se encuentran sujetas a la existencia de las sumas o integrales que las 
definan. 


Definicibn 3.8 Sea X una variable aleatoria. El r-esimo momento de X alrededor 
del cero se define por: 

Mr 

Mr 

El primer momento alrededor del cero es la media o valor esperado de la variable 
aleatoria y se denota por pr, de esta manera se tiene que m! = M = E(X). Con 
base en el material del capitulo uno, la media de una variable aleatoria se considera 
como una cantidad numerica alrededor de la cual los valores de la variable aleatoria 
tienden a agruparse. Por lo tanto, la media es una medida de tendencia central. 


= E(X r ) = 2 x r p(x) si X es discreta, o 


= E(X 


r » - F 


x r f(x)dx si X es continua. 


Definition 3.9 Sea X una variable aleatoria. El r-esimo momento central de X o el 
r-esimo momento alrededor de la media de X se define por: 

p r = E(X - p-Y - ^ (x - n) r p(x) si X es discreta, o 

x 

p. r = E(X - pY = f (x - p.Yf(x)dx si X es continua. 


* Tambien es apropiado emplear la frase momentos de la distribucidn de probabilidad de X. 
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El momento central cero de cualquier variable aleatoria es uno, dado que: 

Mo = E(X - m)° - £(D = 1. 

De manera similar, el primer momento central de cualquier variable aleatoria es 
cero, dado que: 

M ( = E{X - /x) = E{X) - p. = 0. 

El segundo momento central: 

V-2 = E(X - p)\ 

recibe el nombre de varianza de la variable aleatoria. Puesto que: . 

M 2 = VaiiX) = E{X - p) 2 

= E(X 2 -2Xp + fi 2 ) 

= E(X 2 ) - 2 p. 2 + p 2 

= p-2 - p 2 , (3.5) 

la varianza de cualquier variable aleatoria es el segundo momento alrededor del 
origen menos el cuadrado de la media. Generalmente se denota por <x 2 . La varianza 
de una variable aleatoria es una medida de la dispersion de la distribucion de proba¬ 
bilidad de esta. Por ejemplo, en el caso continuo si la mayor parte del area por deba- 
jo de la curva de distribucion se encuentra cercana a la media, la varianza es pe- 
quefta; si la mayor parte del area se encuentra muy dispersa alrededor de la media, la 
varianza sera grande. La raiz cuadrada positiva de la varianza recibe el nombre de 
desviacion estandar y se denota por a. A pesar de que cr : y a son los simbolos mas 
universales para la varianza y la desviacion estandar, respectivamente; en este libro 
no se dudara en emplear las notaciones cr 2 (A') o Var\X) para la varianza y cr(A') o 
d.e. (A) para la desviacion estandar dada su identificacion explicita con la variable 
aleatoria involucrada. Por la misma razon, a veces sera necesario emplear la nota- 
cion p r (X) para denotar el r-esimo momento central de X. 

Es util notar que la varianza de una variable aleatoria X es invariable; es decir, 
Var{X + b) = Var(X) para cualquier constante b. De manera mas general, se de- 
mostraraque Var(aX + b) = a 2 Var(X) para cualesquiera dos contantes a y b. Por 
definicion, 

Var(aX + b) = E(aX + b) 2 - E\aX + b) 

= E(crX 2 + 2abX + b 2 ) - [aE(X) + b] 2 
= a 2 E(X 2 ) + 2abE(X) + b 2 - a 2 E 2 (X) - 2abE(X) - b 2 
= a 2 E(X 2 ) - a 2 E 2 (X) 

= « 2 [£(A : ) - E 2 (X)\ 

= a 2 Var (X). 
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Una medida que compara la dispersi6n relativa de dos distribuciones de probabi- 
lidad es el coeficiente de variacidn, que esta definido por: 

V — (3.6) 

El coeficiente de variation expresa la magnitud de la dispersion de una variable alea¬ 
toria con respecto a su valor esperado. V es una medida estandarizada de la va¬ 
riacion con respecto a la media, especialmente util para comparar dos distribuciones 
de probabilidad cuando la escala de medicion difiere de manera apreciable entre es- 
tas. Por ejemplo, dadas las variables aleatorias X y Y, supongase que: 

£(*) = 120, Var(X ) = 36;£(Y) = 40, Var{Y ) = 16. 

A pesar de que la dispersibn de X, por su desviatibn est&ndar, es m4s grande que la de 
Y, en un sentido absoluto, la dispersibn relativa de X es menor que la dispersibn re¬ 
lativa de Y, puesto que: 


V* = 6/120 = 0.05, 

pero: 

V y = 4/40 = 0.10. 

Por lo tanto, la distribucibn de probabilidad de Y muestra una mayor dispersibn 
relativa con respecto a la media que la distribucibn correspondiente a X. 

En este punto, se examinaran los momentos centrales tercero y cuarto de una va¬ 
riable aleatoria X. Estos momentos centrales proporcionan informacibn muy util 
con respecto a la forma de la distribucibn de probabilidad de X. A pesar de que 
pueden considerarse momentos de orden superior, su utilidad para caracterizar una 
distribucibn de probabilidad es mucho menor que la de los primeros cuatro momen¬ 
tos. El tercer momento central 


M3 = E(X - m) 3 , (3-7) 

estd relacionado con la asimetria de la distribucibn de probabilidad de X. Ya se de- 
mostro que el segundo momento central (la varianza) puede expresarse en terminos 
de los primeros dos momentos alrededor del cero. De hecho, cualquier momento 
central de una variable aleatoria X puede expresarse en terminos de los momentos de 
esta, alrededor del cero. Por definicion: 


Mr = E(X - n)\ 


pero la expansion de (X - fi)' puede expresarse como: 

Ya que la esperanza de una suma es igual a la suma de las esperanzas, se tiene que: 
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En particular, 




= E (-!)' 


(r - *)!/! 


-I 


^3 = ~ 3/X/X2 + 2pt 3 . 


(3.8) 


Para las distribuciones de probabilidad que presentan un solo pico, si p, } < 0, se 
dice que la distribution es asimetrica negativamente; si /t 3 > 0, la distribucibn es 
asimetrica positivamente; ysi /x 3 = 0, la distribucibn recibe el nombre desimitrica. 
Sin embargo, a menos que la distribucibn presente un solo pico, el conocimiento de 
Hi no es suficiente para tener una idea de la forma de la distribucibn. Aun asi, el 
tercer momento central puede dar resultados errbneos, dado que depende de las uni- 
dades en las que se mide la variable aleatoria X. Para estos casos, una medida m&s 
apropiada de la asimetria, es el tercer momento estandarizado, dado por; 

a? = M 3 /(M2 ) V2 , (3.9) 


que recibe el nombre d ecoeficiente de asimetria. El coeficiente a 3 es la medida de la 
asimetria de una distribucibn de probabilidad con respecto a su dispersibn. Una dis- 


* En ocasiones, serii necesario identificar a la variable aleatoria explicitamente, con el propbsito de evitar 
ambiguedades. 





F1GURA 3.7 Funciones de densidad de probabilidad tipicas de distribuciones: a) asimetrica 
positivamente, b) asimetrica negativamente y c) simetrica. 
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tribucion de probabilidad es asimetrica positiva, negativa o simetrica si a } > 0, a 3 
<0, o a 3 = 0 respectivamente, como se muestra en la figura 3.7. Notese que si la 
distribucibn de probabilidad de una variable aleatoria X es simetrica, todos los mo¬ 
mentos centrales de X de orden impar ser&n cero, dado que cada valor positivo de 
(X - n) r se cancela por un valor negativo de la misma magnitud y de igual proba¬ 
bilidad. N 

El cuarto momento central, \ 

= E(X - p) 4 

= M4 - 4 fi. h'i + 6 ix 2 h' 2 - 3 /la 4 , (3.10) 

es una medida de que tan punliaguda es la distribucion de probabilidad y recibe el 
nombre de curtosis. A1 igual que para el tercer momento, es preferible emplear 
el cuarto momento estandarizado, 

= P-Jp-2, (3.11) 

como una medida relativa de la curtosis. Si a 4 > 3, la distribucion de probabilidad 
presenta un pico relativamente alto y recibe el nombre de leptocurtica; si a 4 < 3, la 
distribucion es relativamente plana y recibe el nombre de platicurtica; y si a 4 = 3, 
la distribucibn no presenta un pico muy alto ni muy bajo y recibe el nombre de me- 
socurtica. Los tres tipos de distribuciones se encuentran ilustrados en la figura 3.8. 




b) 


c) 



FIGURA 3.8 Funciones de densidad de probabilidad tipicas de distribuciones: a) leptocurti- 
cas, b) platicurticas y c) mesocurticas 
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El valor de tres se emplea como una referenda debido a que en la pr&ctica la curtosis 
estandarizada de una distribution de probabilidad se compara con la de una distri- 
buci6n ampliamente utilizada, conocida como distribuci6n normal, cuyo valor es 
tres. La distribuci6n normal se estudia con gran detalle prosteriormente. 

Los momentos estandarizados tercero y cuarto, tambien se conocen como los 
factores de forma primero y segundo, respectivamente, de la distribuci6n de proba¬ 
bilidad debido a que, en gran medida, determinan la forma de la distribuci6n de pro¬ 
babilidad. 

Ejemplo 3.8 Dos vendedores de seguros de vida, A y B, visitan de ocho a 12 clien- 
tes potenciales por semana, respectivamente. Sean X y Y dos variables aleatorias 
que representan el numero de sendos seguros vendidos por A y B, como resultado de 
las visitas. Con base en una gran cantidad de information pasada, las probabilida- 
des para los valores de X y Y son las siguientes: 


X 

0 

1 

2 

3 

4 

5 

6 

7 

8 

P(x) 

0.02 

0.09 

0.21 

0.28 

0.23 

0.12 

0.04 

0.01 

0 


y 

0 

i 

2 

3 

4 

5 

6 

7 

8 

9 

10 

II 

12 

p ( y ) 

0.06 

0.21 

0.28 

0.24 

0.13 

0.05 

0.02 

0.01 

0 

V 

0 

0 

0 


Comparar y contrastar las distribuciones de probabilidad de X y Y empleando sus 
medias, varianzas y factores de forma. 

Con base en la definition 3.8, los primeros cuatro momentos de X alrededor del 
cero son: 


P = (0) (0.2) + (1) (0.09) + ••• + (8)(0) = 3.18 

p' 2 = (0) 2 (0.02) + (I) 2 (0.09) + - + (8) 2 (0) = 12.06 

Ms = (0) 3 (0.02) + (I) 3 (0.09) + - + (8) 3 (0) = 51.12 

p\ = (0) 4 (0.02) + (I) 4 (0.09) + ••• + (8) 4 (0) = 235.86. 

A1 emplear las expresiones 3.5, 3.8 y 3.10, respectivamente, se determina que Var(X) 
= 1.95, p 3 (X) = 0.3825 y p 4 (X) = 10.565. Los primeros dos factores de forma de 
la distribucion de probabilidad de X se obtienen empleando (3.9) y (3.11), respecti¬ 
vamente, y son a 3 (X) = 0.1405 y a 4 (X) = 2.78. 

Con el mismo procedimiento, los primeros cuatro momentos de Y alrededor 
del cero son p = 2.45, p' z = 8.03, p'^ = 31.25 y p' 4 - 138.59. De esta mane- 
ra Var(Y) = 2.03, p } (Y) = 1.6418, p,(Y) = 13.4504, a 3 (Y) = 0.5676, y 
a 4 (L) = 3.26. 

A primera vista, parece existir muy poca diferencia entre las distribuciones de X 
y Y con respecto a la media y la varianza, pero la distribucion de Y tiene un sesgo positi- 
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vo m&s grande que la de X. Adem&s, la distribuci6n de X es platicurtica (a 4 < 3), 
mientras que la de Y es leptocurtica (a 4 > 3). 

En este momento se considerar^ el concepto de variable aleatoria estandarizada. Sea 
X cualquier variable aleatoria con media ft y desviacion est&ndar a. La cantidad 

Y = (X - fji)/a (3.12) 

define una variable aleatoria Y con media cero y desviacibn estbndar uno. Esta va¬ 
riable aleatoria recibe el nombre de variable estandarizada correspondiente a X. De 
hecho, para cualquier valor particular x de X el valor y = {x - fi)/ c t indica la des¬ 
viacion del valor x del valor esperado de X en terminos de las unidades de la 
desviacibn est&ndar. Por ejemplo, si X representa la calificacibn de una prueba de 
inteligencia, y si E(X) = 100 y Var(X) = 100, entonces Y = (X - 100)/10 es la va¬ 
riable estandarizada correspondiente a X. Adem&s, si una persona posee un coefi- 
ciente intelectual de 120, entonces se encontrara a dos desviaciones estandar del coe- 
ficiente intelectual medio. 

El valor esperado de Y es cero, puesto que: 



= - E(X - fi) = 0. 

<T 


De hecho, puesto que E(Y) = 0, el r-esimo momento central de Y es: 

fir(Y) = E(Y r ) = 


de esta manera se tiene que: 

fi r (Y) = fiXX)/{fi 2 (X)Y /2 . (3.13) 

De (3.13) es evidente que Var(Y) = /i 2 (Y) = 1. En particular, nbtese que 
«,( Y) = a } (X) y Q! 4 ( Y) = a 4 (X). La estandarizacion de una variable aleatoria 
afecta a la media y a la varianza, pero no a los factores de forma. 



E(X - ft)' 

O' 

H,(X)/<T r -, 


Ejemplo 3.9 Considerense las variables 
dad de probabilidad son 



aleatorias XyY, cuyas funciones de densi- 

80 « -v 110. 

para cualquier otro valor 


y Ay) 


^ e ^-,/10 000 ) 

0 


y > 0, 

para cualquier otro valor; 


www. FreeLibros. com 



74 Variables aleatorias y distribuciones de probabilidad 


Determinar y comparar la media, la varianza y los momentos estandarizados tercero 
y cuarto, de X y Y. 


El principal objetivo de este problema es contrastar las distribuciones de proba¬ 
bilidad de X y de Y, mediante la comparacibn de sus cuatro primeros momentos y, 
en alguna medida, proporcionar un an&logo tebrico de los ejemplos 1.1 y 1.2. El 
lector puede verificar, de manera f&cil, que las distribuciones de probabilidad de Xy 
Y son muy diferentes, graficando las correspondientes funciones de densidad. Como 
se ver&, gran parte de la diferencia puede descubrirse a traves de las comparaciones 
entre los cuatro primeros momentos de X y Y. 

Para facilitar los calculos, sea c, = 1/30 y c 2 = 1/10 000. Para la variable aleato- 
ria X: 

r 1 10 HO 

E(X) = cA xdx^-x 1 =95 

h o 2 80 


'1 10 

Var(X) = c, (x - 95 fdx 

80 


r : 

= C 'L,5 U 


du = 75, 


en donde u = x - 95 y dx = du. Por lo tanto, se tiene que d.e.(X) = 8.66. 
Para los momentos de orden superior: 


E(X - 95f 




(jr - 95 fdx 


r 

= ci J- 15 w 


3 du = 0 


E(X - 95) 4 = c, (x - 95 fdx = c, u A du = 10 125. 

De acuerdo con (3.9) y (3.11), los factores de forma, primero y segundo, de X son 
a 3 (X) = 0/(75) 3/2 = 0 y a 4 (I) = 10,125/5,625 = 1.8, respectivamente. La dis- 
tribucibn de probabilidad de X es simetrica y esta centrada alrededor del valor 95, 
tiene una varianza de 75 y una desviacibn estandar de 8.66, y tiende a ser plana en su 
parte superior. 

Para la variable aleatoria Y: 

E(Y) = c 2 y exp( — c 2 y)dy = c 2 — nexp(-n) — du = I'(2 )/e, = 10 000 

Jo Jo C 2 c 2 

y 

E(Y 2 ) = c 2 y 2 exp( — c 2 y)dy = r(3)/c 2 = 2 x 10 s , 

en donde u = c- 2 y y dy = du/c 2 . De esta manera se tiene que Var(Y) = 1 x 10 8 , y 
d.e.(X) = 10 000. Ademas: 

E(Y 3 ) = r, ^ y 3 exp( - c 2 y)dy = r(4)/c 2 = 6 x I0' : . 
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Con (3.8) y (3.9) se determina que E(Y - 10 000) 3 = 2 x 10'\ y d.e.(Y) = 
10 000. De manera similar: 

£(K 4 ) = c 2 J o y 4 exp (-c 2 y)dy = T(5)/c 4 = 24 x 10 15 . 

\ 

Con(3.10) y (3.11), respectivamente, seobtieneque E(Y - 10 000) 4 = 9 x 10 16 , 
y a^Y) = 9. Puede concluirseque la distribucion de Y estb sesgada positivamente, 
tiene un pico relativamente alto, una media de 10 000, una varianza de 1 x 10 s , y 
una desviacion estandar de 10 000. 


3.6 Otras medidas de tendencia central y dispersion 

A pesar de que la media y la varianza son las principales medidas de tendencia 
central y dispersion, existen otras medidas empleadas comunmente. Se debe recor- 
dar que en el capitulo uno, la mediana y la moda eran otras medidas utiles de ten¬ 
dencia central. 

Definicion 3.10 Para cualquier variable aleatoria X, se define a la mediana jc 0 5 de 
X, para ser: 

P(X < jc 0 5 ) *£ 1/2 y P(X *£ x 0 5 ) 3= 1/2 si A'es discreta, o 
P(X =£ jc 0 5 ) = 1/2 si X es continua. 

Si existe uno de estos valores para X, entonces x 0 .5 recibe el nombre de mediana de 
la distribucion de X. La mediana es una medida de tendencia central, en el sentido 
de que es el valor para el cual la distribucibn de probabilidad se divide en dos partes 
iguales. 

Definicibn 3.11 Para cualquier variable aleatoria X, se define la moda como el 
valor x m de X que maximiza la funcion de probabilidad, si X es discreta, o la fun- 
cion de densidad si X es continua. 

Si existe uno de estos valores para X, entonces x m recibe el nombre de moda de 
la distribucion de X. Si X es continua la moda es la solucion de df(x)/dx = 0 si 
d 2 f{x)/dx 2 < 0. Si la segunda derivada es positiva, el valor recibe el nombre de anti- 
moda; este se encuentra en las distribuciones que tienen forma de U. Si existen 
varios maximos o minimos, las distribuciones de probabilidad reciben el nombre de 
multimodales. 

De acuerdo con la exposicion empirica del capitulo uno, la media de una variable 
aleatoria es generalmente la medida preferida de tendencia central. Sin embargo, en 
algunas situaciones la mediana, y en menor grado la moda, pueden ser medidas de 
tendencia central mucho mas apropiadas. Por ejemplo, en distribuciones unimoda- 
les cuya asimetria es grande, el valor esperado de la variable aleatoria puede verse 
afectado por los valores extremos de la distribucion, mientras que la mediana no lo 
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estara. Para distribuciones unimodales con asimetria negativa, la mediana es mbs 
grande que la media, mientras que lo opuesto es cierto para distribuciones unimoda¬ 
les con asimetria positiva. Para distribuciones unimodales simetricas, la media, me¬ 
diana y moda coinciden en valor. 

Ejemplo 3.10 Sea X una variable alaeatoria que representa el tiempo de duracibn, 
en horas, de un cierto componente electrico. Si la funcibn de densidad de probabili¬ 
dad de X esta dada por 


fix) = 


I 


1000 

Lo 


exp(-;t/1000) x > 0, 

para cualquier otro valor, 


determinar y comparar la media y la mediana. 

La media de A" es: 

E(X) = * - f x exp(-.r/1000)<Lr = 1000 f u exp(- u)du 

1000 Jo Jo 

= 1000r(2) = 1000 horas. 

en donde x = 1 000« y dx = 1 OOOdu. La mediana de A' es: 

P{X ss x 0 .,) = F(x 05 ) = | o exp( - x/\Wft)dx = 0.5 

= 1 - exp( -x ()5 /1000) - 0.5. 


Por lo tanto, 

x 05 = - 1000 ln(0.5) = 693.15 horas. 

Se puede demostrar que esta funcion de probabilidad es asimetrica positivamen- 
te, puesto que su coeficiente de asimetria es a 3 = 2. De esta forma, la duracibn 
media de 1 000 horas se encuentra afectada por los valores de la variable aleatoria en 
los extremos de la distribucion. De hecho la probabilidad de que un componente tra- 
baje mas que el valor promedio, es de 0.3679 puesto que 

P(X> p) = 1 - F\p) = 1 - 0.6321 = 0.3679. 

En este caso, el valor de la mediana para el tiempo de duracibn, 693.15 hr, resulta 
ser una medida mas apropiada de tendencia central. 

Ademas de la varianza, existen otras medidas de dispersion para variables aleato¬ 
rias como el recorrido interdecil, el recorrido intercuartil y la desviacion media, 
como se menciono en el capitulo uno. Los primeros dos son funciones de los cuanti- 
les de la distribucion de probabilidad. La desviacion media es el paralelo conceptual 
de la desviacion estandar, con excepcion de que se emplea el valor absoluto de la di- 
ferencia entre el valor de la variable aleatoria y su valor esperado en lugar del 
cuadrado de esta. 
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Definicibn 3.12 Para cualquier variable aleatoria X, el valor cuantil x q de orden q, 
0 < q < 1, es el valor de X tal que: 

P(X < x q ) « q y P(X x q ) 3= q si X es discreta, o 
P{X ^x q ) = q si A' es continua. 

Generalmente los valores cuantiles de una variable aleatoria continua son relati- 
vamente faciles de determinar. Sin embargo, para variables aleatorias discretas los 
valores cuantiles generalmente se obtienen por interpolacion, dado que no siempre 
es posible obtener una solucibn exacta. 

Los cuantiles utilizados comunmente son los percentiles, deciles y cuartiles. Los 
percentiles son los puntos que dividen a la distribucibn de probabilidad en 100 inter- 
valos, cada uno con probabilidad 0.01; los deciles y cuartiles son los puntos que dividen 
a la distribucibn de probabilidad en 10 y cuatro intervalos, cada uno con probabili¬ 
dad de 0.1 y 0.25, respectivamente. Notese que la mediana es tambienel cincuentavo 
porcentil, el quinto decil y el segundo cuartil. 

El recorrido interdecil es la diferencia entre el noveno y primer decil, y el recorri- 
do intercuartil es la diferencia entre el tercer y primer cuartil. De esta manera el 
recorrido interdecil es una medida de la dispersion de la mitad del 80% de la distri¬ 
bucibn de probabilidad, en tanto que el recorrido intercuantil refleja la variacion de 
la mitad del 50% de la distribucibn. En ambos casos, al excluir los efectos de los va¬ 
lores extremos de la distribucibn, se tiene la capacidad de medir la variabilidad de 
una variable aleatoria alrededor de la mitad de su distribucibn de probabilidad. 

Los recorridos interdecil e intercuartil, son dos medidas de dispersibn que se 
emplean en disciplinas como educacion, economia, finanzas e ingenieria. El recorri¬ 
do interdecil se emplea muchas veces en pruebas educacionales para medir la varia¬ 
bilidad en el desempefio sin importar los valores por arriba o por debajo de un 10% 
de un valor predeterminado. El recorrido intercuartil se emplea en muchas oca- 
siones, en economia y finanzas, para medir la variabilidad de una variable aleatoria 
alrededor de una porcibn de su distribucibn de probabilidad. 

Definicibn 3.13 La desviacion media de una variable aleatoria X es el valor espera- 
do de la diferencia absoluta entre X y su media, y esta dado por: 

E\X - /a| = Yj k ~ lApW si X es discreta, o 

totla v 

E\X - /x| = J \x - fi\f{x)dx si A" es continua, 

A pesar de que la desviacion media es una medida legitima de dispersibn, existen dis- 
tribuciones de probabilidad para las que dar un tratamiento analiticoes o muy dificil 
o imposible. A pesar de todo y como se ilustro en el capitulo uno, la desviacion me¬ 
dia es una alternativa viable a la desviacion estandar como medida de dispersibn 
para conjuntos de datos cuyo fundamento se encuentra en evidencia empirica. Debe 
notarse que para distribuciones con valores grandes en sus extremos, el valor de la 
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desviacibn media se ve menos afectado que la desviacibn estandar por la existencia 
de valores extremos. 


Ejemplo 3.11 Supongase que en cierto proceso de llenado, la desviacion entre el 
peso verdadero de un recipiente con respecto al valor especifico, es una variable 
aleatoria Z, cuya funcion de densidad de probabilidad esta dada por 


f(z) = 



exp(-z 2 /2) 


-x < z < x. 


Determinar la media, la desviacion estandar, el recorrido interdecil, el recorrido in- 
tercuartil y la desviacion media de Z. 


Como se ver& en el capitulo cinco, esta funcibn de densidad es un miembro espe¬ 
cial de una familia muy util en las distribuciones que reciben el nombre de familia 
normal o Gausiana. De hecho, la funcibn de distribucion acumulativa de Z se en- 
cuentra bien tabulada, como puede observarse en la tabla D del apendice. Ademas, 
como se vera posteriormente: 

E(Z) = 0, Var(Z) = 1, y d.e.(Z) = 1. 

Para determinar el recorrido interdecil, los valores cuantiles z 0 y z og se en- 
cuentran definidos por: 

■ t — f exp(-t 2 /2)dt = 0.1 y I exp {-t 2 /2)dt = 0.9 

\l2-n ] -~ V2 n J - x 

y se obtienen de la tabla D*; sus valores son z 0 l = - 1.28 y z 0 . 9 = 1.28. El recorri¬ 
do interdecil es Z0.9 - z 0 .i = 2.56 En otras palabras, el 80% de todos los reci- 
pientes presentaran una desviacion no mayor de 1.28 unidades, en cualquier direc- 
cibn del peso especificado. De manera similar, a partir de la tabla D los valores 
cuantiles z 0 25 y Z 0.75 son -0.675 y 0.675 respectivamente. Por lo tanto, el recorrido 
intercuartil es Z 0.25 = -0.675 Z 0.75 ~ Z 0.25 = 1-35 unidades. 

Puesto que para la desviacibn mediana E(Z) = 0, se tiene: 

E\Z\ = 


* El uso de la tabla D se explica con mucho detalle en el capitulo cinco. 


== f |z|exp(-z 2 /2)dz 

7/77 J ' x 

z exp(-z 2 /2)^z 


xjlrs 

—-— r 

\/2v 


exp( -z 2 /2) 


\/2tt 
2/yj2rr 

0.7979 unidades 
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NOtese que dado que la desviaciOn estandar es uno, el recorrido interdecil es de apro- 
ximadamente 2.56 unidades de la desviatiOn estandar, el recorrido intercuartil es de 
1.35 unidades de la desviatiOn estandar y la desviatiOn media tiene un valor de apro- 
ximadamente 0.7979 unidades de la desviacion estandar. Los resultados anteriores 
son siempre v&lidos para la familia de distribuciones normales. 

El siguiente ejemplo ilustra una situation teOrica, en la que se tiene una distribu- 
ci6n con algunos valores muy grandes y para la cual la mediana, el recorrido interde¬ 
cil y el recorrido intercuartil son medidas de tendencia central y dispersion mOs apro- 
piadas que la media y la varianza. 

Ejemplo 3.12 Sea X una variable aleatoria cuya funciOn de densidad de probabili- 
dad estO dada por: 



1/2 exp(-x l/2 /4) 


jc >0 


(.0 para cualquier otro valor. 

Determinar la media, la varianza, la desviatiOn estandar, la mediana, el recorrido 
intercuartil y el recorrido interdecil de X. 


Se deja como ejercicio la gr&fica de esta funcion de densidad de probabilidad y 
verificar que su integral sea igual a uno. El lector no tendril ningun problema para 
notar que esta funciOn de densidad exhibe un r&pido decaimiento hacia el eje hori¬ 
zontal; teniendo en cuenta esta propiedad, la distribution anterior puede ser apro- 
piada para representar la edad a la que fallece una persona como resultado de las 
enfermedades padecidas en su niflez, como la escarlatina y la difteria (hace una gene- 
raciOn) y, en mayor frecuencia, la leucemia (en la actualidad). 


El valor esperado de X es: 

E(X) = - f x l/2 exp(-x l/2 /4)dx = | f 4u exp(- u)32udu = 16r(3) = 32, 

8 Jo 8 Jo 

en donde u = x x,1 /4, x — 16w 2 , y dx = 32 udu. De manera similar: 

E(X 2 ) = || o x 3/2 exp(-x' ,2 /4)dx = 256 f g u 4 exp(-u)du = 256f(5) = 6 144. 


de manera tal que Var ( X) = 5 120 y d.e.(X) = 71.55. 

Para determinar los valores cuantiles, primero se obtendra la funciOn de distri¬ 
bution acumulativa: 

i f* r 1/2/4 

E(x) = - I t~ ,/2 cxp(-t u */4)dt = exp (~u)du = 1 - exp(-x l/2 /4), 

8 Jo Jo 

en donde u = t >/2 /4 y dt - 32 udu. Por definiciOn, la mediana es el valor x 05 tal 
que F( Xoj) = 0.5. Por lo tanto: 
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1 - exp(-jro<j/4) = 0.5 

exp(-jr$/4) = 0.5 
( - Jfo5/4) = ln(0.5) 

JC8.J = [ — 4 ln(0.5)] 2 = 7.6872. 


En otras palabras, el 50% de los valores de X seran menores de 7.6872, a pesar de 
que la media tiene un valor de 32, lo que constituye una diferencia muy grande entre 
los valores de la media y la mediana. Para demostrar cuan inapropiada es la media 
de X como unica medida de tendencia central, considerese la probabilidad de que X 
sea menor que su valor medio: 

P(X< 32) = F( 32) - 1 - exp(-32' /2 /4) = 0.7569. 


De acuerdo con lo anterior, el valor de 32 para la media dificilmente puede interpre- 
tarse como una medida representativa de tendencia central si la probabilidad de que 
la variable aleatoria exceda el valor de su media es menor de 0.25. 

Los percentiles decimo, 25avo, 75avo y 90avo se determinan encontrando el va¬ 
lor de x q de las ecuaciones F(x q ) = 0.1, 0.25, 0.75, y 0.90, respectivamente. Por 
lo tanto: 

1 - exp(-jfa?/4) = 0.1 
expi-x'o'f/4) = 0.9 

= [-4 ln(0.9)] 2 , 

y jc 0 ., = 0.1776. De manera similar, jc ()25 = [-4 ln(0.75)l 2 = 1.3242,.r 0 75 = [-4 
ln(0.25)] 2 = 30.7490, yx 09 = [-4 ln(0.1)] 2 = 84.8304. El recorrido intercuar- 
til de X es x 0 75 - jc 025 = 30.7490 - 1.3242 = 29.4248, el recorrido interdecil 
esx 0 . 9 ~ *o i = 84.8304 - 0.1776 = 84.6528. Notese que la desviacion estandar de 
X es, aproximadamente 2.5 veces el recorrido intercuartil y casi tan grande como el re¬ 
corrido interdecil. Este resultado, junto con los hechos de que el 25% de los valores 
son menores de 1.3242, el 50% es menor de 7.6872 y el 75% menores de 30.49, de- 
muestran que la varianza, y por lo tanto la desviacion estandar, son inadecuadas como 
unicas medidas de variabilidad. 


3.7 Funciones generadoras de momentos 

Hasta este momento se han presentado distintas formas para determinar los momen¬ 
tos de una variable aleatoria dada su distribution de probabilidad. Como metodo al¬ 
ternative se presenta la esperanza de cierta funcion conocida como funcion genera- 
dora de momentos. 

Definicion 3.14 Sea X una variable aleatoria. El valor esperado de exp(tX) recibe 
el nombre de funcion generadora de momentos, y se denota por m x U). si el valor es- 
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perado existe para cualquier valor de t en algun intervalo - c < t < c en donde c 
es un numero positivo. En otras palabras: 


MxU) - E[exp(/A')] = ^ exp(/x)p(jt) si X es discreta, o 

X 

m x (t) = £[exp(/A)] = J ^e\p(tx)f(x)dx si A' es continua. 


N6tese que m x (t) nada mas es funci6n del argumento /. Si / = 0, entonces m y (0) 
= E(e°) = 1. Si la funci6n generadora de momentos existe, puede demostrarse que 
es unica y que determina por completo la distribucion de probabilidad de X. En otras 
palabras, si dos variables aleatorias tienen la misma funcibn generadora de momen¬ 
tos, entonces tienen la misma distribucion de probabilidad. Este resultado se utilizar&, 
de manera extensa, en el capitulo siete. 

Si la funcion generadora de momentos existe para - c < t < c, entonces existen 
las derivadas de estade todas las ordenes para t = 0. Lo anterior asegura que m x (t) 
generara todos los momentos de X alrededor del origen. Para demostrar lo anterior, 
se diferencia m x (t) con respecto a t, y se evalua la derivada en / = 0. Suponiendo 
que pueden intercambiarse los simbolos de diferenciacion y esperanza, se tiene: 


dm x (t) 

dl 


= —E[expUX)] 


= E\ — [expl/A)] 
dl 


= E [A'expUA')] Uo 
= E (X) = fi. 

A1 tomar la segunda derivada y evaluar en t = 0. 


d 2 m x (t) 

dr 


cE 

dl 


2 E [expl/A*)] 


E j ~ [exp(/A)J 


= E - [X exp(/A)] 

1 at 

= E [X 2 expl/A)] U 0 
= E(X 2 ) = fj.' 2 . 

A1 continuar este proceso de diferenciacibn se puede deducir que se obtiene el 

www. FreeLibros. com 


82 Variables aleatorias y dislribuciones de probabilidad 


d r m x (t) 

dt r 


= ^- r £[exp(/A')] 


= E \ d - 
l df 


[exp(zA')] 


= E [A rr exp(/A r )] | (=0 
= E(X r ) = fi' r . 


mismo resultado si se reemplaza la funcion exponential por su expansibn en serie de 
potencias 

( Ay 2 t r X r 

1 + tX + —— !-••■ + —— + ••• 

y se ton>an las derivadas con respecto a t, evaluando cada una de estas en / = 0. 

La noci6n de una funci6n generadora de momentos puede extenderse a otros 
puntos de referencia, ademas del origen. En particular, se define una funcibn central 
generadora de momentos la que, si existe, generara todos los momentos centrales de 
una distribucibn de probabilidad. 

Definici6n 3.15 Sea X una variable aleatoria. El valor esperado de exp[/(A r - q.)] 
recibe el nombre de funcion generadora de momentos central y denota por m x _ u (/), 
si el valor esperado existe para cualquier t en algun intervalo- c < t < c en donde 
c es un numero positivo. 

= £{exp[/(A' - /x)]} = X exp[/(jr - p)]p(x) si X es discreta, o 

x 

= £{exp[/(A r - /x)]} = J exp[/(x - p)\f(x)dx si X es continua. 


La comprobacidn de que genera todos los momentos centrales se deja 

como ejercicio al lector. 

Ejemplo 3.13 Sea X una variable aleatoria con funcion de densidad de probabilidad 


fix) 


\ l -exp(-x/6) J>0 


para cualquier otro valor. 


en donde 0 es un numero mayor que cero. Determinar la funcion generadora de mo¬ 
mentos de X. 
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Por definition 


m x (t) 


-if 

e Jo 

-i r 

0 Jo 


exp(/jr) exp(-x/6)dx 


exp 

0 






(9(1 - 0/) 
= (1 - 


exp 


-x\ - - t 

\e 


Por lo tanto: 


dm x (t) 

dt 


d 2 m x (t) 

dt 2 


= 0(1 - dt)" 2 


1 = 0 


1 = 0 


= 0 = E(X), 


= 20 2 (I - 0/)“ 


= 20 2 = £(;r 2 ). 

dando como resultado, Var(X) = 2d 1 - 0 2 = 0 2 , y asi sucesivamente. 

Ejemplo 3.14 Sea X una variable aleatoria discreta con funcion de probabilidad: 

exp(-X)X r 


p(x) = 


x\ 


X = 0, 1,2,..., 


en donde X es un numero mayor que cero. Determinar la funcion generadora de mo¬ 
mentos de X. 

De acuerdo con la definition se tiene: 

exp(/.r)exp( -X) X' 


m 


.Ao = 2 


= exp(-X) X 


.r! 

[X exp(r)]' 


Dado que: 


2 ^Ewr = , + w + 


.V! 


xV' 

2 ! 


x\ 


XV" 

+ -l- —— + 


= exp[X exp(/)]. 
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entonces: 

Por lo tanto: 


m x (t) = exp(-X) exp[Xexp(r)]. 


dm x (t) 

dt 


= Xexp(-X)exp{/)exp 


X exp(/) 


= X = E(X). 
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Ejercicios 

3.1. Sea X una variable aleatoria que representa el numero de llamadas telefonicas que reci- 
be un conmutador en un intervalo de cinco minutos y cuya funcion de probabilidad estft 
dada por p(x) = e 3 (3)'/-*!, x = 0, 1, 2, ... . 

a) Determinar las probabilidades de que X sea igual a 0, 1, 2, 3, 4, 5, 6 y 7. 

b) Graficar la funcion de probabilidad para estos valores de X. 

c) Determinar la funcion de distribucibn acumulativa para estos valores de X. 

d) Graficar la funcion de distribution acumulativa. 

3.2. Sea X una variable aleatoria discreta. Determinar el valor de k para que la funcion p{x) = 
k/x, x = 1, 2, 3, 4, sea la funcion de probabilidad de X. Determinar P(1 X 
< 3). 

3.3. Sea X una variable aleatoria continua. 

a) Determinar el valor de k, de manera tal que la funcion 

f kx 2 - 1 s.ts I, 

fix) = 

l 0 para cualquier otro valor 

sea la funcion de densidad de probabilidad de X. 

b) Determinar la funcion de distribucion acumulativa de X y graficar F\x). 

c) Calcular P{X s= 1/2) y P(- 1/2 X « i/2). 

3.4. Sea X una variable aleatoria continua. 

a) Determinar el valor de k para que la funcion 

f k exp( -x/5) x > 0, 

J(x) = j 

L 0 para cualquier otro valor 

sea la funcion de densidad de probabilidad dp X 
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b) Graficar J(x). 

c) Calcular P(X s= 5) y F(0 =s X *£ 8). 

d) Determinar F{x) y graficarla. 


Ejercicios 85 


3.5. La duraci6n en horas de un componente electr6nico, es una variable aleatoria cuya fun- 
ci6n de distribucibn acumulativa es F(x) = 1 - exp{ -x/100), x > 0. 

a) Determinar la funcibn de probabilidad de X. 

b) Determinar la probabilidad de que el componente trabaje mas de 200 horas. 

3.6. La funcibn de distribucibn acumulativa de una variable aleatoria esta dada por 


F(x> = 


0 

lx - x 1 

J 


x < 0, 
0<.r< 1, 
jr > 1 . 


a) Graficar F\x). 

b) Obtener P(X < 1/2) y P(X > 3/4). 

c) Determinar J{x). 


3.7. Sea X una variable aleatoria que representa el numero de clientes que llega a una tienda 
en un periodo de una hora. Dada la siguiente informacibn 


X 

0 1 

2 

3 

4 

5 

6 

7 

8 

p(x) 

0.05 0.10 

0.10 

0.10 

0.20 

0.25 

0.10 

0.05 

0.05 


encontrar E(X) y Var{X). 

3.8. Una compaflia de seguros debe determinar la cuota anual a cobrarse por un seguro de 
$50 mil para hombres cuya edad se encuentra entre los 30 y 35 aflos. Con base en las 
tablas actuariales el numero de fallecimientos al aflo, para este grupo, es de 5 por cada 
mil. Si X es la variable aleatoria que representa la ganancia de la compaflia de seguros, 
determinar el monto de la cuota anual para que la compaflia no pierda, a pesar de tener 
un numero grande de tales seguros. 

3.9. La funcibn de densidad de probabilidad de una variable aleatoria X esti dada por: 


Determinar: 
a) E(X) 


Ax) = 


2(1 - x) 
0 


0 < x < 1, 

para cualquier otro valor 


b) Var(X) 


3.10. Sea X una variable aleatoria que representa la magnitud de la desviacibn, a partir de un 
valor prescrito, del peso neto de ciertos recipientes, los que se llenan mediante una ma- 
quina. La funcibn de densidad de probabilidad de X esta dada por: 

f 1/10 0<x< 10 

/(x) = 

l 0 para cualquier otro valor 


c) a,(A") 

d) a,(X) 


Determinar: 

a) E(X) 

b) VariX) 


www. FreeLibros. com 


86 Variables aleatorias y distribuciones de probabilidad 


3.11. Sup 6 ngase que la duracibn en minutos de una llamada de negocios, es una variable alea- 
toria cuya funcion de densidad de probabilidad esta determinada 

7 exp(— jc/4) jc > 0, 

fix) = 4 

0 para cualquier otro valor 

Determinar: 

a) E(X) 

b) Var(X) 

c) a,(X) 

d) a<{X) 

e) Refierase al ejercicio 3.10. Bas&ndose en sus respuestas a las preguntas a, a d del 
problema 3.11, compare las dos distribuciones de probabilidades. iCu&l muestra la 
mayor dispersibn relativa? 

3.12. La calificacibn promedio en una prueba de estadistica fue de 62.5 con una desviacibn es¬ 
tandar de 10. El profesor sospecha 4 ue _i examen fue diflcil. De acuerdo con lo ante¬ 
rior, desea a'ustar las calificaciones de manera que el promedio sea de70 y la desviacibn 
estandar de 8 . iQue ajuste del tipo aX + h, debe utilizar? 

3.13. Sea X una variable aleatoria con media /x y varianza a 2 . 

a) Evaluar E(X - c ) 2 en terminos de p. y cr 2 en donde c es una constante. 

b) iPara que valor de c es EfX - c ) 2 minimo? 

3.14. Con respecto al ejercicio 3.11, demostrar que la variable aleatoria Y = (X - 4)/4 
tiene media cero y desviacibn estandar uno. Demostrar que los factores de forma, pri- 
mero y segundo, de la distribucion de Y son los mismos de la distribucion de X. 

3.15. Considerese la funcion de densidad de probabilidad deX dada enel ejercicio 3.9. Deter¬ 
minar la desviacibn media de X y compararla con su desviacibn estandar. 

3.16. Considerese la funcion de densidad de probabilidad de X dada en el ejercicio 3.10. De¬ 
terminar la desviacibn media de X y compararla con su desviacibn estandar. 

3.17. Supongase que el ingreso semanal de un asesor profesional es una variable aleatoria 
cuya funcion de densidad de probabilidad esta determinada por: 

fs^ exp( “ JC / 800) JC>0 - 

fix) = j 800 

lo para cualquier otro valor 

a) Determinar los ingresos medios y medianos. 

b) Determinar el recorrido intercuartil. 

c) Determinar el recorrido interdecil. 

d) Determinar la probabilidad de que el ingreso semanal exceda al ingreso promedio. 

3.18. Comprobar que la funcion generadora de momentos central de una variable aleatoria 
X, genera todos los momentos centrales de X. 

3.19. La funcion de densidad de probabilidad de una variable aleatoria X esta determinada: 

77 -r exp( — .v/4) .v > 0, 

.fix) = 16 

.0 para cualquier otro valor 
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a) Determinar la funci6n generadora de momentos de X. 

b) Utilizar la funcibn generadora de momentos para encontrar la media y la varianza de X. 

3.20. Considerese la funcion de densidad de probabilidad dada en el ejercicio 3.11. Encontrar 
la funcion generadora de momentos y utilizarla para comprobar los valores de la media 
y la varianza, determinados en el ejercicio 3.11. 

3.21. Sea X una variable aleatoria discreta con funcion de probabilidad p(x) x = 0,1,2,...,//, 
y sean a, b, y c constantes. Demostrar que E(c) = c, E(aX + b) = uE(X) + b, _ y 
E[g(X) + h(X)\ = E{g(X )] + E[h(X)\, en donde g(x) y h(x) son funciones de X. 

3.22. Para la variable aleatoria discreta del ejercicio anterior, utilizar las definiciones 3.8 y 3.9 
para demostrar que Var(X) = E(X~) - E l (X). 
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CAPITULO CUATRO 


Algunas distribuciones 
discretas de probabilidad 


4.1 Introduction 

En el capitulo dos se establecieron algunos principios basicos de probabilidad. En el 
capitulo tres estos principios se aplicaron para definir variables aleatorias y distri¬ 
buciones de probabilidad asi como para desarrollar sus propiedades generales. En 
los capitulos cuatro y cinco se examinaran con detalle algunas distribuciones especi- 
ficas de probabilidad que han demostrado, empiricamente, ser modelos utiles para 
diversos problemas practicos. A pesar de ello tales distribuciones presentan un ca- 
racter teorico en el sentido en que sus funciones de probabilidad o de densidad de 
probabilidad se deducen matematicamente con base en ciertas hipotesis que se supo- 
nen validas para los fenomenos aleatorios. La election de una distribucion de proba¬ 
bilidad para representar un fenomeno de interes practico debe estar motivada tanto 
por la comprension de la naturaleza del fenomeno en si, como por la posible verifi¬ 
cation de la distribucion seleccionada a traves de la evidencia empirica. En todo mo- 
mento debe evitarse aceptar de manera tacita una determinada distribucion de pro¬ 
babilidad como modelo de un problema practico. 

Se examinaran varias distribuciones tanto discretas como continuas. En cada 
caso se expondran detalladamente las caracteristicas distintivas de las distribuciones 
particulars de probabilidad y se deduciran o se estableceran sus medias, varianzas, 
factores de forma, y otras medidas descriptivas numericas. Como se sugirio en el 
capitulo uno, una distribucion de probabilidad esta caracterizada, de manera gene¬ 
ral, por una o mas cantidades que reciben el nombre de parametros de la distribu¬ 
cion. Un parametro puede tomar cualquier valor de un conjunto dado y, en ese sen¬ 
tido, define una familia de distribuciones de probabilidad, que tendran la misma 
funcion generica de probabilidad o funcion de densidad de probabilidad. Se trataran 
varios tipos de parametros tales como el conteo, la proportion, la rapidez, la locali¬ 
zation y la forma. Se adoptaran las letras n y k para referirse a los parametros de 
conteo, p para la proportion X para la rapidez, p. para la localization, a yd para 
la escala, y a y /3 para la forma. Cuando la presentacion sea de una naturaleza muy 
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general y no se este tratandoningun tipo de parametro en particular, se empleara 9 
para designar ese parametro. 

Los parametros de conteo y de proporcion son autoexplicatorios. Un parametro 
de rapidez representa la rapidez en que ocurre un evento aleatorio en el tiempo o en 
el espacio. Un par&metro de localizacion relaciona la funcion (densidad) de probabi- 
lidad con el origen de la escala de medicion, localizandola sobre el eje de las x sin te¬ 
net algun efecto sobre su apariencia. La presenciade un parametro de localizacion ft 
en la funcion de probabilidad es siempre de la forma (x - fx). Un parametro de es¬ 
cala es una cantidad que relaciona las unidades fisicas de la variable aleatoria y de 
esta forma la escala. Un parametro de escala influye sobre la dispersion de una va¬ 
riable aleatoria, y de esta forma afecta la apariencia de la funcion de probabilidad. 
La aparicion de un parametro de escala en la funcion de probabilidad es de la forma 
x/9. Un parametro de forma afecta la forma de la funcion de probabilidad en di- 
verso grado, dependiendo del modelo en particular. A pesar de que en muchas oca- 
siones el parametro de forma se encuentra en un exponente en la funcion de probabi¬ 
lidad, no existe ninguna forma estandar en la que pueda asociarse ax sin importar su 
aparicion en la funcion de probabilidad. 

Se examinaran con detalle cuatro familias de distribuciones de probabilidad 
discreta y se haran comentarios sobre su aplicacion. Estas son las distribuciones bi¬ 
nomial, Poisson, hipergeometrica y la binomial negativa. 


4.2 La distribution binomial 

Es una de las distribuciones discretas de probabilidad mas utiles. Sus areas de aplica¬ 
cion incluyen inspection de calidad, ventas, mercadotecnia, medicina, investigation 
de opiniones y otras. Se puede imaginar un experimento en el que el resultado es la 
ocurrencia o la no ocurrencia de un evento. Sin perdida de generalidad, llamese 
“exito” a la ocurrencia del evento y “fracaso” a su no ocurrencia. Ademas, sea p la 
probabilidad de exito cada vez que el experimento se Ueva a cabo y 1 -p la probabili¬ 
dad de fracaso. Supongase que el experimento se realiza n veces, y cada uno de estos 
es independiente de todos los demas, y sea X la variable aleatoria que representa el 
numero de exitos en los n ensayos. El interes esta en determinar la probabilidad de 
obtener exactamente X = x exitos durante los n ensayos. Las dos suposiciones cla¬ 
ves para la distribucion binomial son: 

1. La probabilidad de exito p permanece constante para cada ensayo. 

2. Los n ensayos son independientes entre si. 

Varios problemas practicos parecen adherirse razonablemente a las suposiciones 
anteriores. Por ejemplo, un proceso de manufactura produce un determinado produc- 
to en el que algunas unidades se encuentran defectuosas. Si la proporcion de unidades 
defectuosas producidas por este proceso es constante durante un periodo razonable y, 
si como procedimiento de rutina, se seleccionan aleatoriamente un determinado nume¬ 
ro de unidades, entonces las proposiciones de probabilidad con respecto al numero de 
articulos defectuosos puede hacerse mediante el empleo de la distribucion binomial. 
La publicidad para la venta de un producto tambien puede considerarse otro ejemplo. 
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Si se supone que la probabilidad de venta es constante para todas las personas, la 
distribucion binomial sera el modelo de probabilidad adecuado puesto que las perso¬ 
nas tienen un criterio independiente para comprar. Como ejemplo final, el Centro 
para el Control de Enfermedades tiene, entre sus distintas funciones, la responsabili- 
dad de vigilar las enfermedades transmisibles. Para cumplir con ella, debe examinar la 
propagation de una enfermedad determinada con base en la probabilidad. Es dudoso 
que la probabilidad de contraer una enfermedad transmisible, sea constante para toda 
la poblacion. Sin embargo, para una parte de esta, por ejemplo las personas que 
tienen una edad determinada, si puede ser constante, de manera tal que la distribucion 
binomial puede ser un modelo de probabilidad adecuado. 

Para obtener la funcion de probabilidad de la distribucion binomial, primero se 
determina la probabilidad de tener, en n ensayos, x exitos consecutivos seguidos de n 
-x fracasos consecutivos. Dado que, por hipotesis, los n ensayos son independientes 
de la definition 2.15, se tiene: 

P ■ p ••• p ■ (I - p)( 1 - p) •• (1 - p) = p'( 1 - p)"~'. 

'-v-' .-' 

x terminos (n - x) terminos 

La probabilidad de obtener exactamente x exitos y n-x fracasos en cualquier otro 
orden es la misma puesto que los factores p y (1 - p) se reordenan de acuerdo con el 
orden particular. Por lo tanto, la probabilidad de tener x exitos y n-x fracasos en 
cualquier orden, es el producto de p x ( 1 - p) n ~ x por el numero de 6rdenes distintos. 
Este ultimo es el numero de combinaciones de n objetos tomando x a la vez. De 
acuerdo con lo anterior se tiene la siguiente definicidn: 


Definici6n 4.1 Sea X una variable aleatoria que representa el numero de exitos en n 
ensayos y p la probabilidad de exito con cualquiera de estos. Se dice entonces que X 
tiene una distribucion binomial con funcion de probabilidad.* 


p(x\ n, p) = < 


n\ 


, .. . PV - p) n -' 

(n - x)\x\ 

0 para cualquier otro valor. 


x = 0, 1,2, ..., n, 

0 p =£ 1, para n entero. 


(4.1) 


Los parametros de la distribucion binomial son n y p. Estos definen una familia 
de distribuciones binomiales, en donde cada miembro tiene la funcion de probabili¬ 
dad determinada por (4.1). Para ilustrar el efecto de estos parametros, la figura 4.1 
proporciona algunas graficas de la distribucion binomial. Se dara mas information 
sobre estas cuando se discutan los momentos y otras medidas descriptivas. 

El nombre “distribucion binomial” proviene del hecho de que los valores de p 
(x; n, p) para x = 0, 1, 2 ... n son los terminos sucesivos de la expansion binomial de 
1(1 - p) + p]"\ estoes. 


* Para mantener la consistencia, se empleara la notacion p{ ) para indicar la funcion basica de probabili¬ 
dad. El autor no piensa que el lector se confundira por el empleo de p (x; n, p) para la funcion de probabi¬ 
lidad binomial y el uso de la letra p para el parametro de proporcion. 


i 
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n = 5, p = 0.2 n = 5, p = 0.5 n=S,p=0.8 



FIGURA 4.1 Graficas de la funci6r. binomial de probabilidad 


[d - p) + p]" = (1 - P)" + n(l - P)"~'p + ni \. ~(1 - P)" 2 P 2 + • 


2 ! 


• + P" 


n 

= X P( x '- n ’ P)- 


Pero dado que [(1 - p) + p]" = 1 y p(x; n, p) 3* 0 parax = 0, 1, 2 ... n, este 
hecho tambien verifica que p (x; n, p) es una funcion de probabilidad. 

Para ilustrar el dilculo de probabilidad mediante el empleo de (4.1) sea n = 5 y 
p = 0.4 entonces: 

p(x\ 5, 0.4) = /c 5! (0.4r(0.6) s \ x = 0, 1, 2, 3, 4, 5; 

(5 - jc) ! jc! 


asi: 


P( 0; 5, 0.4) = ■ J 5 - ^ - (0.4)°(0.6) 5 0 = 0.0778, 

p(l; 5, 0.4) = - - (0.4)'(0.6) 5-1 = 0.2592, 

p(2; 5, 0.4) = (5 T 5 U (0 - 4) ' (0 - 6) " : = °' 3456 ' 

p(3; 5, 0.4) = (0.4) , (0.6) , ‘ 3 = 0.2304, 
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p(4; 5 ’ °’ 4) = (5 - ~4 )T 4\ (0 - 4)4(0 - 6)5_4 = 0 0768 ’ 

p(5; 5, 0.4) = — 5 (0.4) 5 (0.6)*- ? = 0.0102. 

La probabilidad de que una variable aleatoria X sea menor o igual a un valor 
especifico de x, se determina por la funcibn de distribution acumulativa 

P{X ^ x) = F(x-, n,p) = £ (^fj p\ 1 - p) n -'. (4.2) 

La distribucion binomial se ha tabulado de manera extensa para distintos valores 
de n y p, ya sea mediante el empleo de (4.1) o (4.2) o ambas. En la tabla A del apen- 
dice, se proporcionan las probabilidades acumulativas para distintos valores dex, n, y 
p. Pueden determinarse las probabilidades individuales mediante el empleo de esta 
tabla puesto que la variable aleatoria binomial tiene un valor entero, y la propiedad 

pix\n,p) = F(x;n,p) - F(x - 1 \n,p) 

se verifica. Para ilustrar el uso de la tabla A, sea n = 10 y p = 0.3. La probabilidad 
de que X pueda ser cuatro es: 

P(X *£ 4) = F(4; 10, 0.3) = 0.8497; 

la probabilidad de que X sea mayor de dos es: 

P(X > 2) = P(X 5* 3) = 1 - P(X *£ 2) = 1 - F( 2; 10, 0.3) = 0.6172; 

y la probabilidad de que X sea de exactamente cinco es: 

pi 5; 10, 0.3) = F( 5; 10, 0.3) - F(4; 10, 0.3) = 0.1030. 

Debe notarse que si n = 1, la funcion de probabilidad binomial se reduce a: 

V(i-p)'~ A x = 0, I, 

pix\ p) = (4.3) 

0 para cualquier otro valor, 

que es la funcion de probabilidad de la distribucibn puntual o de Bernoulli. La 
distribucion de Bernoulli recibe este nombre por el probabilista suizo Jacques Ber¬ 
noulli (1654-1705) quien desarrollo por primera vez el concepto de ensayos indepen- 
dientes. 

Ejemplo 4.1 Todos los dias se seleccionan, de manera aleatoria, 15 unidades de un 
proceso de manufactura con el proposito de verificar el porcentaje de unidades de- 
fectuosas en la produccion. Con base en informacion pasada, la probabilidad de te- 
ner una unidad defectuosa es de 0.05. La gerencia ha decidido detener la produccion 
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cada vez que una muestra de 15 unidades tenga dos o mbs defectuosas. ^Cubl es la 
probabilidad de que, en cualquier dia, la produccibn se detenga? 

Si el modelo apropiado para esta situacibn es la distribucibn binomial, se puede 
suponer que las 15 unidades que se seleccionan al dia, constituyen un conjunto de 
ensayos independientes de manera tal que la probabilidad de tener una unidad defec- 
tuosa es 0.05 entre ensayos. Sea X el numero de unidades defectuosas que se en- 
cuentran entre las 15. Para n = 15 y p = 0.05, la probabilidad deque la production se 
detenga es igual a la probabilidad de que X sea igual o mayor que dos. De esta ma¬ 
nera: 

P(X^ 2) = 1 - P(X^ 1) = 1 - F(l; 15,0.05) = 0.1709. 

Ejemplo 4.2 Supbngase que para personas de determinada edad, la probabilidad 
de que mueran por una enfermedad transmisible es 0.001. iCu&ntas personas de este 
grupo pueden exponerse a la enfermedad de manera que la probabilidad de que no 
mas de una persona muera sea por lo mencs 0.95? 

Para aplicar la distribucibn binomial a esta situacion, la suposicibn crucial es que 
la probabilidad de muerte es constante para todos los individuos que forman parte 
del grupo y que contraen la enfermedad. Sea X el numero de muertes que ocurren en 
n individuos por haber contraido el padecimiento. El valor de n para que la probabi¬ 
lidad de que X sea menor o igual a uno tenga un valor mayor o igual a 0.95: 

P{X « 1) = F(\;n, 0.001)5=0.95, 

y para la igualdad: 

X (0.001/(0.999)" ' = 0.95 

j (0.001)°(0.999)" + (0.001/(0.999)"” 1 = 0.95 

(0.999)"”‘(0.999 + 0.001/0 = 0.95. 

Esta ecuacibn no se resuelve de manera explicita para n; sin embargo, mediante el 
empleo de tecnicas iterativas* puede determinarse que el valor entero de n que satis- 
face la ecuacibn es n = 356. 

En este punto se determinaran los momentos para la distribucibn binomial. Se 
ilustraran tanto el metodo directo, con base en la definicion 3.8, como el mbtodo in- 
directo, con base en la funcion generadora de momentos. 


* Una tfccnica iterativa es un metodo numerico para resolver una ecuacidn mediante una sucesion de valo- 
res hasta que el ultimo valor se encuentra muy cercano al que satisface la ecuacidn. 
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Por la definici6n 3.8, el primer momento alrededor del cero de la variable aleato- 
ria binomial X es el valor esperado de X, 


E(X) = 2 X 


n\ 


(n - x)\x\ 


p\ 1 - pT 


= 2 


(n - j:)!jc! 


pV - pT 


= 2 


n\ 


(n - x)\(x - 1)! 


p x ( i - pr x . 


en donde se ha escrito la suma desde uno hasta n, dado que cuando x = 0 el primer 
termino es cero y se cancela la x del numerador con la x en x!. Factorizando n y p, se 
tiene: 


E( *> - n 4,< ^r- 


Siy = x- lym = n-l, entonces: 


E(X) = np 2 


ml 


o( m ~ 


P y ( 1 - P)"~ y . 


Pero p(y; m, p) = [m\/{m - - p) m ~ y es la funcibn de probabili¬ 

dad de una variable aleatoria binomial Y con par&metros m = n - 1 y p\ de esta ma- 
nera 2” =0 p(y\ m, p) = 1, y la media de una variable aleatoria binomial es: 

E(X) = p = np. (4.4) 

Para obtener la varianza, se necesita el segundo momento alrededor del cero, p'i, 
o: 


EiX 1 ) = ^ x 2 p(x\ n,p)\ 

x = 0 

pero, en el termino x L /x\ se cancelara una sola xen el numerador, y la que resta evi- 
tara que la suma se manipule de la misma forma en que se determino la media. La al- 
ternativa es escribir x 2 como: 


x 2 = x(x - 1) + x\ 

de esta manera se tiene: 

E(X 2 ) = E[X(X - 1)] + E(X). (4.5) 

Dado que E(X) ya se ha determinado, puede usarse el mismo procedimiento para 
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evaluar E[X(X - 1)]: 

E[X{X - 1)] = £ x(x - 1) - p\ 1 - p)"- x 

(n - 


x = 0 


= 2 xix- D- ——-p*a - pr 

x= 2 (« - *)!•*•' 


= 2 


n ! 


2 in - x)\(x - 2)1 


P x (1 ~ pr x 


= nin - 1 )p 2 E ~ j! —P- 2 (1 - p)"' 

x -2 i n ~ x)l(x - 2)! 

Notese que en los pasos anteriores se escribi6 la suma a partir de dos porque los dos 
primeros terminos son cero, se canceld x(x - 1), y se factorizo nin - 1 )p 2 . Sea 
y = x- 2ym = n-2\ entonces: 


E[X{X - 1)] = nin - l)p 2 £ 


ml 


P y i\ - pY 


=0 irn - y)\y\ 

m 

= nin - 1 )p 2 2 Piy\ m ,p) 

y=o 

= n(n - l)p 2 . 

De (4.5) 

EiX 2 ) = p’ 2 = nin - l)p 2 + np. 

De esta manera, la varianza de una variable aleatoria binomial es: 
VariX) = p' 2 - p. 2 

= nin - l)p 2 + np - n 2 p 2 
= np [in - l)p + 1 - np] 

= npil - p). 


(4.6) 


Este metodo general puede extenderse para determinar los momentos de orden 
superior. Por ejemplo, para obtener el tercer momento alrededor del cero, se deter- 
mina E[XiX - l)iX - 2)] dado que: 

E[XiX - \)iX - 2)]* = p'i- 3p( + 2p. (4.7) 

De manera similar, para el cuarto momento alrededor del cero se evalua E[X{X - 1) 
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(X - 2)(X - 3)] dado que: 

E[X{X - 1)(* - 2)(X - 3)]* = + 11/4 - 6/4. (4.8) 

Para una variable aleatoria binomial: 


E[X(X - l)(X - 2)] = 2 x(x - l)(x - 2) -.. . pV - pT 

* = 0 \fl x)\x. 

pV - pY~ x 


n\ 


= Y — 

(n - x)l(x - 3)! 


= n(n - l)(n - 2 )p i ^ 

x = 3 
m 

= n(n - 1)(« - 2)p 3 2 

* = 0 


(n - 3)! 


(n - x)\{x - 3)! 


P*~ 3 (l - pY 


m\ 


(m - >)!>'! 


p v ( 1 - P)" 


= *(* - 1)(* - 2)p\ 

Mediante el empleo de (4.7), 


, /4 — 3/^2 + 2 /a = «(n — I)(/i - 2)/? 3 

/4( = «(« - l)(/z - 2)p i + 3 [n{n - l)p : + np] - 2np 

= n(n — 1 )(n — 2 )p 3 + 3«(n - 1 )p 2 + np. (4.9) 

El tercer momento central /4 3 puede determinarse por (3.8), 

/4 3 = «(« - l)(/t - 2)/? 3 + 3 n(n - 1 )p 2 + np - 3 np[n(n - \)p 3 + np] + 2n i p i , 
la que, despues de un poco de algebra, se reduce a: 

/4 3 = np{ 1 - />)(! - 2p). (4.10) 


Por lo tanto, de (3.9) el tercer momento estandarizado de la distribution binomial es: 


np{ 1 - p)(l - 2 p) 

[np( 1 - p)] 3/2 

flp(l - p)d ~ 2 p) 
np( I - /?)(«/?(1 - p)] l/: 

1 ~ 2p 

[«p(l - p)] l/2 ‘ 


(4.11) 


* Expresiones como estas dan lo que se conoce como momenlos factoriales. De hecho, el r-esimo moraen- 
to factorial de una variable aleatoria X es E\XiX - I )(X - 2) (X - r + I)]. 
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Para ti cuarto momento alrededor del cero, se tiene: 

n 

E[X(X - 1)C* - 2)(X - 3)] = 2 x(x - 1)U - 2)U - 3) 


x =*0 


(n - jc)!J t! 


P\ 1 - pT' 1 


-s 


At! 


p x o - pr x 


~ 4 U - JC)!U - 4)! 

= n(n - 1)U - 2)U - 3)p 4 

V ~ 4)? x — 4 /1 _ y. 

2j , P (1 p) 

X = 4 U - *)'U - 4)! 

= n(n - 1)U - 2)(n - 3)p 4 


ml 


P y ( 1 - P)" 


,-oU* - y)!y! 

= n(n - 1)U - 2)U - 3)p 4 . 

Sustituir en (4.8) y para resolver p 4 , se tiene: 

p 4 = n(n - 1)U - 2)(/? - 3)p 4 + 6 [n(n - 1)U - 2 )p 2 

+ 3«(« - l)p 2 + Atp] - ll[«(« - l)p 2 + np] + 6np. (4.12) 
De acuerdo con (3.10), el cuarto momento central es: 

p 4 = p 4 “ 4/xp; + 6 p 2 P2 - 3p\ 

el que, despues de una sustitucidn adecuada y un poco de manipulation algebraica, es 
p 4 = /jp(l - p){3/ip( 1 - p) + [1 - 6p(l - p)]}. (4.13) 

De acuerdo con (3.11), el cuarto momento estandarizado de la distribucidn binomial 
es: 

np(\ - p){3np(I - p) + [1 - 6p(l - p)]} [ 1 — 6p(l - p)] ,, 

a A - 5—5— -5 ——- = 3 + -—-:-• (4.14) 

n p (1 - p) np(\ - p) 


Las propiedades basicas de la distribucidn binomial se encuentran resumidas en 
la tabla 4.1. Notese que la media de una variable aleatoria binomial es el producto 
del numero de ensayos y la probabilidad de exito en cada uno de estos y la varianza 
es el producto de la media por la probabilidad de tener un fracaso. La varianza de 
una variable aleatoria binomial siempre es menor que el valor de su media. 
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TABLA 4.1 Propiedades b&sicas de la distribucibn binomial. 


Funcidn de probabilidad 


Par&metros 

x = 0, 1 , 2, .... n 


n, entero positivo 

p, 0 « p « 1 

Media Varianza 

Coeficiente de 
sesgo 

Curtosis relativa 


1 - 2 P 

3 , [1 - 6p(l - p)J 

np np{ 1 - p) 

[np(\ ~ P)] U1 

np(l - p) 


Para obtener una mejor perspectiva de la distribucibn binomial y de su fori”a , 10 
calcular&n a 3 y a 4 para distintos valores del parimetro n, de acuerdo con la tabla 
4.2. Puede concluirse a partir de esta, que la distribucibn binomial es simetrica si p 
= 1/2, con sesgo positivo si p < 1/2, y sesgada negativamente si p > 1/2. Para 
los ultimos dos casos, el sesgo se vuelve menos evidente conforme n es mas grande. 
Ademas, la distribucibn binomial es relativamente plana si p = 1/2. Para cualquier 
otro valor de p, la distribucibn binomial presenta un pico relativamente grande. Sin 
embargo, si n es grande a 4 tiende a tres para cualquier valor de p y la distribucibn 
es mesocurtica. 

De acuerdo con la definicibn 3.14, la funcibn generadora de momentos para la 
distribucibn binomial es: 

n I 

mAt) = E(e ,x ) = 2 g* r- in pX(l ~ p )n ' x 

^ = 0 x).x. 


- - p) " 
- (1 - P y + # 1(1 - py-\e'p) 


+ 


2 ! 


(1 - py- 2 (e'p) 2 + - + (e'py 


= [(1 - P) + e'py. 


(4.15) 


TABLA 4.2 Factores de forma de la distribucibn binomial para distintos valores de p 



p = 1/10 

P = 1/2 

p = 9/10 


8 


8 

<*} 

3 

0 

3 \fn 


. 46 

, 2 

, 46 

OCa 

3 + — 

3- 


9 n 

n 

9 n 
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A1 tomar las dos primeras derivadas de (4.15) con respecto a t, se tiene: 
dm x (t) 


dt 


= ne'p[(l - p) + e'p) 


in — I 


d m x (t) 


dt 


~ = n(n - l)(e'pr[(l - p) + e' P r 2 + ne'p[( 1 - />) + £•>]'■ “ 1 . 


Si t = 0, se obtienen los momentos primero y segundo alrededor del cero, 
dm x {t) 


dt 


= np [(1 - p) + p] 


71 - 1 




= "P 


y: 


d 2 m x (t) 
dt 2 


= n(n - l)p [(1 - p) + p]" + «Pl(l - P) + Pi 


in-1 


- n(n - 1 )p 2 + np. 


que son identicos a los determinados mediante el empleo del metodo directo. Los 
momentos de orden superior pueden determinarse mediante la continuacion de este 
proceso de diferenciacion y al evaluar la derivada en t = 0. Notese que para este 
caso los primeros dos momentos alrededor del cero se obtienen de manera mas facil 
empleando la funcion generadora de momentos que tiene el metodo directo. Sin em¬ 
bargo, esto no ocurre en general. 


Ejemplo 4.3 Un club nacional de automovilistas comienza una campafla telefonica 
con el proposito de aumentar el numero de miembros. Con base en experiencia pre¬ 
via, se sabe que una de cada 20 personas que reciben la llamada se une al club. Si en 
un dia 25 personas reciben la llamada telefbnica <,cu&l es la probabilidad de que por 
lo menos dos de ellas se inscriban al club? <,Cu&l es el numero esperado? 

Puesto que una de cada 20 personas se suscriben al club, p = 0.05. Ademas, si se 
supone que las 25 personas constituyen un conjunto de ensayos independientes (una 
suposicion muy razonable en este caso) con una probabilidad constante p = 0.05 de 
suscribirse al club, y si la variable aleatoria X es el numero, de entre n = 25, que ter- 
mina suscribiendose al club, la probabilidad deseada es: 

P(X 2» 2) = 1 - P(X 1) = 1 - F(l; 25, 0.05) = 0.3576. 

Mediante el empleo de (4.4), el valor esperado de X es E(X) = (25)(0.05) = 1.25. 
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4.3 La distribuci6n de Poisson 

Llamada asi en honor de Simeon Denis Poisson, probabilista frances del siglo XIX. 
quien fue el primero en describirla, es otra distribucibn discreta de probabilidad 
muy util en la que la variable aleatoria representa el numero de eventos independien- 
tes que ocurren a una velocidad constante. Muchos eventos aleatorios ocurren de 
manera independiente con una velocidad constante en el tiempo o en el espacio. Al- 
gunos ejemplos tipicos son el numero de personas que llegan a una tienda de auto- 
servicio en un tiempo determinado, el numero de defectos en piezas similares para el 
material, el numero de bacterias en un cultivo, el numero de solicitudes de seguro 
procesadas por una compaflia en un periodo especifico, etc. De hecho, la distribu¬ 
cibn de Poisson es el principal modelo de probabilidad empleado para analizar 
problemas de lineas de espera. Ademas, ofrece una aproximacibn excelente a la fun- 
cibn de probabilidad binomial cuando p es pequeflo y n grande. La deduccibn de la 
funcibn de probabilidad de Poisson se desarrolla en un apendice que se encuentra al 
final de este capitulo. 


Definicibn 4.2 Sea X una variable aleatoria que representa el numero de eventos 
aleatorios independientes que ocurren a una rapidez constante sobre el tiempo o el 
espacio. Se dice entonces que la variable aleatoria X tiene una distribucibn de Pois¬ 
son con funcibn de probabilidad. 


p(x\ X) 


Vv 

. jc! 

0 

V 


x = 0, 1, 2, ...; X > 0, 

para cualquier otro valor. 


(4.16) 


El parametro de la distribucibn de Poisson es X, el numero promedio de ocurren- 
cias del evento aleatorio por unidad de tiempo. Para valores mayores que cero, X defi¬ 
ne una familia de distribuciones con una funcibn de probabilidad determinada por 
(4.16). En la figura 4.2 se proporcionan algunas graficas de la funcibn de probabili¬ 
dad de Poisson, para distintos valores de X: 


FIGURA 4.2 Graficas de la funcion de probabilidad de Poisson 


x 

Cl. 
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Puede verificarse que (4.16) e$ una funci6n de probabilidad, puesto que 
pix\ X)> 0 parax = 0, 1, 2...y 


S pix ; X) = 2 




x = 0 


— e 




= 1 + X + - + 


= e"V 


= 1 . 


Para ilustrar, sea X = 1.2; entonces 

e~ ,2 \.r 


p(x; 1.2) = 


x: 


De esta forma se tiene 


e~'-1.2° 

p( 0; 1.2) = — — = 0.3012, 
e- ,2 1.2' 

pH; 1.2) = —rr— = 0.3614, 


x = 0, 1,2. 


e~ ,2 l.2 4 

p( 4; 1.2) = = 0.0260, 


Pi 2; 1.2) = 


1! 

e~' 2 \2 2 


2 ! 


= 0.2169, 


12 1 , 2 3 


Pi 3; 1.2) = 


3! 


= 0.0867, 


P(5; 1.2) = 

P(6; 1.2) = 

Pi 7; 1.2) = 


4! 

g~‘ 2 l-2 5 

5! 

g~ l2 1.2 6 

6! 

f ~ l2 1.2 7 

7! 


= 0.0062, 

= 0 . 0012 , 

= 0 . 0002 . 


A pesar de que puede continuarse este proceso sin finalizar, n6tese que las proba- 
bilidades individuales son m&s y mbs pequeflas conforme la variable aleatoria toma 
valores cada vez mas grandes. Esta es una caracteristica general de la distribucibn de 
Poisson. 

La probabilidad de que una variable aleatoria de Poisson X sea menor o igual a 
un valor de x se determina por la funcion de distribution acumulativa. 

■< - x x , 

PiX^x) = Fix ; X) = E ——■ (4.17) 

, = o l - 

En la tabla B del apendice, se encuentra tabulada (4.17) para distintos valores dex y 
X. Notese de nuevo que la variable aleatoria de Poisson tiene un valor entero, y que 
pueden usarse los valores de las probabflidades acumulativas de la tabla B para de- 
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terminar las probabilidades individuates mediante el empleo de la relacibn: 
p(x\ X) = F(x; X) - F(x - 1; X). 

A continuacibn se dan varios ejemplos del empleo de la tabla B. Sea X = 2.5. 
La probabilidad de que X sea menor que tres es: 

~ ^ V ‘ P(X < 3) = P(X « 2) = F{ 2; 2.5) = 0.5438; 

■' - :: . 2 - i) 

la probabilidad de que X sea mayor que cuatro es: 

■’ P{X s* 4) = 1 - F(*=£ 3) = 1 - F( 3; 2.5) = 0.2424; 

y la probabilidad de que X tome el valor de dos esta dada por: a ■ 

p( 2; 2.5) = F(2; 2.5) - F(l; 2.5) = 0.2565. " '■ " 


Ejemplo 4.4 Despues de una prueba de laboratorio muy rigurosa con cierto compo- 
nente electrico, el fabricante determina que en promedio, sblo fallarbn dos componen- 
tes antes de tener 1 000 horas de operacibn. Un comprador observa que son cinco los 
que fallan antes de las 1 000 horas. Si el numero de componentes que fallan es una 
variable aleatoria de Poisson, ^existe suficiente evidencia para dudar de la conclu¬ 
sion del fabricante? 

La duda en estadistica puede apoyarse en terminos de la probabilidad. Si un 
evento debe o no ocurrir bajo ciertas condiciones, su ocurrencia se decide en termi¬ 
nos de la probabilidad del evento bajo esas condiciones. Si la probabilidad de 
ocurrencia es pequefia y el evento ocurre, entonces se puede preguntar, con justifica- 
cibn, por las condiciones. A1 mismo tiempo debe tenerse en mente que un valor de 
probabilidad pequeflo no impide la ocurrencia del evento, a menos que este valor sea 
cero. En dicho caso, se tiene que X = 2. Se supone que la frecuencia con que 
ocurren las fallas es constante e igual a dos por cada mil horas o un promedio de 
1/500 unidades por hora. La probabilidad de que fallen cinco componentes en mil 
horas es: 


e~ 2 2 s 

p{ 5; 2) = — = 0.0361, 

y la probabilidad de que por lo menos fallen cinco en 1 000 horas es: 

c P(X 5* 5) = 1 - F(4; 2) = 0.0527. 

Ambas probabilidades son, de manera relativa, pequefias. Esto es, si el numero 
de fallas en mil horas esta descrita de manera apropiada por la distribucion de Pois¬ 
son con una frecuencia constante de dos, existe una probabilidad de observar exac- 
tamente cinco unidades defectuosas de 0.0361 y una probabilidad de 0.0527 de ob¬ 
servar por lo menos cinco en el mismo periodo de operacion. Sin embargo, antes de 
tomar cualquier medida en contra del fabricante, es necesario contestar algunas pre- 
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guntas. Por ejemplo, £es la frecuencia de falla constante e igual a dos durante rail 
horas? Aun si lo anterior fuese cierto, ies el medio de operacidn el mismo bajo el 
cual el fabricante hizo sus pruebas? Esto es, £es posible tener factores extrafios, 
introducidos de manera inadvertida, que esten causando un numero tan alto de 
fallas? Las preguntas anteriores s61o pueden constestarse con una comprensibn 
completa de la situacibn. 

... ' \ - 

Ejemplo 4.5 Considerese el juego de futbol que se efectua entre los 28 equipos que 
constituyen la Liga Nacional de Futbol (NFL). Sea la variable aleatoria de interns el 
numero de anotaciones — seis puntos (touchdowns) — de cada equipo por juego. 
Con el presente numero de anotaciones por equipo en la temporada de 1979, iexiste 
alguna raz6n para creer que el numero de anotaciones es una variable aleatoria de 
Poisson? 


Para contestar a esta pregunta, se comparar&n los resultados observados con los 
que se esperarian si el numero de anotaciones fuese una variable aleatoria de Pois¬ 
son, como se muestra en la tabla 4.3. La cuarta columna indica la probabilidad teb- 
rica para cada uno de los valores que aparecen en la primera columna, suponiendo 
que el numero de anotaciones es una variable aleatoria de Poisson. 

Los valores de la cuarta columna se determinan con el calculo del valor del para- 
metro X de la distribucion de Poisson y la evaluation de la funcibn de probabilidad 
(4.16) para los valores de la columna uno. El valor de X se obtiene sumando los pro- 
ductos de las correspondientes posiciones de la primera y tercera columnas, 

X = (0X0.0781) + (1X0.2210) + ••• + (7)(0.0067) 

= 2.435 


TABLA 4.3 Distribuci6n del numero de anotaciones de seis puntos por equipo y por juego 
en la NFL, durante la temporada de 1979 


Numero de 
anotaciones 

Numero de 
veces 

observadas 

Frecuencia 

relativa 

Probabilidad 

teorica 

Numero 
esperado de 
ocurrencias 

0 

35 

0.0781 

0.0876 

39.24 

1 

99 

0.2210 

0.2133 

95.56 

2 

104 

0.2321 

0.2597 

116.34 

3 

no 

0.2455 

0.2108 

94.44 

4 

62 

0.1384 

0.1283 

57.48 

5 

25 

0.0558 

0.0625 

28.00 

6 

10 

0.0223 

0.0254 

11.38 

7* 

3 

0.0067 

0.0124 

5.56 

T otales 

448 

0.9999 

1.0000 

448 


* En realidad, esta cifra representa siete o m&s anotaciones, pero su ocurrencia es definitivamente escasa 
en la NFL. 
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lo que representa el numeros promedio de anotaciones por equipo y por juego. Las 
probabilidades puntuales se calculan mediante el empleo de: 

, . ^ - 2.435(2 435).t 

p{x\ 2.435) =-;-- x = 0, 1,2. 

jc! 

Estos son los primeros siete renglones de la cuarta columna. El ultimo rengldn es la 
probabilidad de que X sea mayor o igual a siete. Los renglones de la ultima columna 
se encuentran multiplicando cada renglbn de la columna cuatro por 448. 

La comparacibn de las columnas dos y cinco, o de las columnas tres y cuatro, re¬ 
vela una concordancia muy razonable. Por lo tanto, puede concluirse que el numero 
de anotaciones es una variable aleatoria de Poisson. Que la variable aleatoria sea del 
tipo Poisson, se basa en que el numero de anotaciones por equipo y por juego en la 
NFL es un conjunto de eventos aleatorios independientes, de manera que la frecuen- 
cia de anotacibn es constante durante los 60 minutos del juego. La frecuencia de 
anotacibn puede ser m&s constante en la NFL como consecuencia de la calidad del 
juego y del oponente que en el futbol colegial. 

La distribucibn de Poisson tambien es una forma limite de la distribucibn bino¬ 
mial cuando n -* * y p-+0 de manera que no permanece constante. Este resul- 
tado se obtiene mediante el siguiente teorema, formulado por Simeon Poisson. 

Teorema 4.1 Sea X una variable aleatoria con distribucibn binomial y funcion de 
probabilidad: 

p(x; n,p ) = --— p'( 1 - /?)" -r x = 0, 1,2, ... n. 

(rt - x)!.v! 

Si para n = 1, 2 ... la relacibn p = k/n es cierta para alguna constante X > 0, en- 
tonces: 

e ~ k \' 

lim p(x\n,p) = ——, x = 0,1,2 . 

x\ 
p-+ o 

La prueba del teorema 4.1 se proporciona en un apendice al final del capitulo. 

En el contexto del teorema 4.1, la distribucion de Poisson se piensa como aquella 
en la que la variable aleatoria puede tomar valores distintos (n es grande pero las 
probabilidades son pequeflas) y — p = k/n tiene un valor cercano a cero. Como 
resultado, la funcibn de probabilidad de Poisson se emplea de manera extensa para 
aproximar la funcion de probabilidad binomial cuando n es, de manera relativa, 
grande y p pequeflo, de manera tal que X = up tiene un valor moderado. En la tabla 
4.4. se ilustra la mejoria en la aproximacion Poisson de la funcion de probabilidad 
binomial conforme n crece y p decrece tal que X = np permanece constante e igual 
a dos. 

Ejemplo 4.6 Un comprador de grandes cantidades de circuitos integrados ha adop- 
tado un plan para aceptar un envio de estos y que consiste en inspeccionar una 


www. FreeLibros. com 


4.3 La distribucidn de Poisson 105 


TABLA 4.4 Comparaci6n de las probabilidades binomial y de Poisson 





Binomial 


de Poisson 

X \ 

p(x\ 10 , 0.2) 

p(x\ 20 , 0.1) 

p(x\ 40, 0.05) 

p(x; 100 , 0.02) 

p{x\ 2 ) 

m 

0.1074 s 

0.1216 

0.1285 

0.1326 


i 

0.2684 



0.2707 


2 

0.3020 

0.2852 

0.2777 

0.2734 

0.2707 

3 

0.2013 

0.1901 

0.1851 

0.1823 

0.1804 

4 

0.0881 

0.0898 

0.0901 

0.0902 

0.0902 

5 

0.0264 

0.0319 

0.0342 

0.0353 

0.0361 

6 

0.0055 

0.0089 

0.0105 

0.0114 

0.0120 

7 

0.0008 

0.0020 

0.0027 

0.0031 

0.0034 

8 

0.0001 

0.0004 

0.0006 

0.0007 

0.0009 

9 

0.0000 

0.0001 

0.0001 

0.0002 

0.0002 


muestra aleatoria de 100 circuitos provenientes del lote. Si el comprador encuentra 
no mis de dos circuitos defectuosos en la muestra, acepta el lote; de otra forma, lo 
rechaza. Si se envia al comprador un lote que contiene 1 % de circuitos defectuosos, 
icual es la probabilidad de que este sea aceptado? 

Sea A" la variable aleatoria que representa el numero de circuitos defectuosos en- 
contrados en una muestra de 100 y supdngase que A'tiene una distribucidn binomial. 
En otras palabras, se supone que los 100 circuitos seleccionados del lote constituyen 
100 ensayos independientes, de manera tal que la probabilidad de tener un circuito 
defectuoso es constante e igual a 0.01. La probabilidad de aceptar el lote es la misma 
de X con valor menor o igual a dos. Dado que n = 100 es relativamente un valor 
grande y p = 0.01 es pequefto; la probabilidad binomial puede aproximarse median- 
te la distribucidn de Poisson, escogiendo X = np - 1: 

P( aceptacibn) = P{X =s 2) = F P *( 2; 1) = 0.9197. 

Debe notarse por comparacion que si se empleara la distribucidn binomial se 
tendria: 

P(X « 2) = F«*(2; 100, 0.01) = 0.9206. 


Los momentos de la variable aleatoria de Poisson se determinan mediante los 
mismos procedimientos utilizados para obtener los momentos de la variable aleatoria 
binomial. Si X es una variable aleatoria de Poisson, su valor esperado es: 


E(X) = X 


.Y! 


X' 


(.v - I)! 


* Se emplean ios subindices para distinguir entre las dos funciones de distribution. Se empleardn las mis- 
mas marcas para distinguir entre dos funciones de probabilidad, cuando sea necesario. 
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X'- 


U - D! 

= y = X - \ 

v-o y- 


= x. 

Para la varianza X: 

x 

E[X(X - 1)] = 2 x(x - 1) 

= xv- i 


jc! 

.r-2 


,= 2 U-2)! 

= y = * -2 


“oy! 


= X 2 . 


Entonces, de (4.5): 

y la varianza de X es: 


E(X 2 ) = p' 2 = X 2 + X, 

Var(A') = p’ 2 - p 2 

= X 2 + X - X 2 
= X. 


(4.18) 


(4.19) 


(4.20) 


De esta manera, una caracteristica distintiva de la variable aleatoria de Poisson es 
que su media es igual a su varianza. 

El ejercicio para el lector es que demuestre que, para el tercer momento central, 
se tiene: 


E[X(X - 1)(* - 2)] = X 3 . 
Mediante el empleo de (4.7): 

Pi — X' + 3X 2 + X, 

y el tercer momento central es: 

Pi = X. 

Como resultado, el coeficiente de asimetria se determina por: 

a l ~ P‘l/^2 12 = 1/VX. 


(4.21) 


(4.22) 
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Para el cuarto momento central puede emplearse el mismo procedimiento para 
demostrar que: 

E[X(X - IX* - 2)(X - 3)] = X 4 , (4.23) 

y de (4.8): 

= X 4 + 6X 3 + 7X 2 > X. (4.24) 

Mediante el empleo de (3.10) el cuarto momento central e$: 

ju 4 = 3X 2 + X, 

y el cuarto momento estandarizado para la distribucidn de Poisson lo establece: 

«4 = pjp l = 3 + ( 4 - 25 ) 

Se proporciona un resumen de las propiedades de la distribucidn de Poisson en la 
tabla 4.5. La distribucidn de Poisson se encuentra sesgada positivamente para cual- 
quier valor X > 0, pero la asimetria disminuye para valores relativamente grandes 
de X. Adem&s, la distribucidn de Poisson es leptocurtica, puesto que « 4 es mayor 
que tres, pero tiende a convertirse en mesocurtica para valores grandes de X. 

La funcidn generadora de momentos para la distribucidn de Poisson se determi- 
na por: 

m x (t) = 


e~ K k x 


1 = 0 


x\ 




e~ y e ke ‘ 


exp [X(<?' - 1)]. 


(4.26) 


TABLA 4.5 Propiedades basicas de la distribucidn de Poisson 


Funcidn de probabilidad 


Parametro 

P(x; X) = 

jc = 0 , 1, 2, ... 


k > 0 

Media 

Varianza 

Coeficiente 
de asimetria 

Curtosis relativa 

k ' 

X 

1 

3 + i 
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N6tese que, como se esperaba: m x (0) = <? x<l_l) = 1. El ejercicio para el lector es 
demostrar que (4.26) da los momentos de la variable aleatoria de Poisson despues de 
llevar a cabo el proceso de diferenciacibn apropiado. 

En conclusibn, la distribucibn de Poisson es leptocurtica con un sesgo positivo y 
se emplea para modelar el numero de eventos aleatorios independientes que ocurren 
a una rapidez constante ya sea sobre el tiempo o el espacio. Se ha empleado de mane- 
ra extensa para el estudio de linea de espera, confiabilidad y control de calidad. Es 
tambien una forma limite de la distribucibn binomial y la aproxima de manera ade- 
cuada para valores grandes de n y pequeftos de p. Sin embargo, debe aplicarse cuida- 
dosamente la distribucibn de Poisson a situaciones en las que las condiciones de in- 
dependencia y rapidez constante de ocurrencia son dudosas. 

Por ejemplo, considerese la distribucibn del numero de infracciones recibidas por 
los automovilistas en un periodo de diez afios. Puede argumentarse que la distribu¬ 
cibn de Poisson es el modelo de probabilidad adecuado, pues la probabilidd de reci- 
bir una infraccibn en un dia cualquiera es pequefla > ha., muchos dias en diez aiios. 
Sin embargo, no es comun que las condiciones de independencia y rapidez constante 
sean validas. La independencia es dudosa debido a que si un automovilista en parti¬ 
cular recibe una infraccibn, es razonable pensar que manejarb de manera mas cuida- 
dosa. En grupos de distinta edad esta frecuencia puede variar, ya que las compaflias 
aseguradoras sostienen que los conductores de mayor edad respetan mis los limites 
de veiocidad que los conductores jbvenes. 


4.4. La distribution hipergeometrica 

Para establecer las condiciones basicas que llevan a otra distribucibn discreta de pro¬ 
babilidad conocida como hipergeometrica, considerese el siguiente problema: sea N el 
numero de representantes de un determinado estado que asisten a una convencion 
politica nacional, y sea k el numero de los que apoyan al candidato A, mientras 
que el resto N~k apoya al candidato B. Supbngase que una organizacion informativa 
selecciona aleatoriamente a n representantes y les pregunta sus razones para apoyar 
a los cartdidatos. Si X es una variable aleatoria que sustituye el numero de represen¬ 
tantes en la muestra que apoyan al candidato A, <,cual es la funcibn de probabilidad 
de XI 

Esta situacibn parece ser binomial porque entre N representantes de un estado 
existen dos grupos distintos con probabilidad k/N y (N - k)/N. Sin embargo, consi¬ 
derese con m&s detalle el proceso de seleccion para la muestra de n representantes. 
Es razonable suponer que se selecciona un representante, se le preguntan sus razones 
y no vuelve a ser seleccionado.* El resultado es que no existe independencia entre la 
seleccion de un representante y el siguiente. Por ejemplo, supbngase que el primer 
representante seleccionado apoya al candidato A. Entonces quedan N - 1 represen¬ 
tantes de los cuales k - 1 apoya a A. Por lo tanto, la probabilidad condicional de que 


* Esto se conoce como muestreo sin reemplazo y es una condition fundamental para la distribucion hi¬ 
pergeometrica. En la distribucion binomial, se supone que el muestreo se hace con reemplazo, aseguran- 
do la independencia y la probabilidad constante. 
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el siguiente candidato apoye tambien a A es (k -1 )/(N -1) y no k/N, y la probabili- 
dad condicional de que el siguiente representante apoye a B es (TV ~k)/(N -1) y no 
(N - k)/N. 

Para determinar la probabilidad de que, de maneras exacta, se seleccionen x 
representantes queapoyen a A y n-x que apoyen a B, se procederb de la siguiente 
forma: el numero de maneras distintas en que puede seleccionarse una muestra de n 
representantes de un total de TVes (^); y cada muestra tiene una probabilidad de selec¬ 
tion igual a 1/(*). De manera similar, la selection de x personas que apoyen a A es 
un evento que puede ocurrir de (* ) maneras distintas, y la seleccion de (n -x) repre¬ 
sentantes que apoyen a B es un evento que puede suceder de C!, I k x ) maneras. El nu¬ 
mero total de maneras en que ambos eventos pueden ocurrir es (*)(* : *). De esta 
forma, la probabilidad de seleccionarx representantes que apoyen al candidato A es 



Definicibn 4.3 Sea TV el numero total de objetos en una poblacion finita, de mane¬ 
ra tal que k de estos es de un tipo y N - k de otros. Si se selecciona una muestra alea- 
toria* de la poblacion constituida por n objetos de la probabilidad de que x sea de un 
tipo exactamente y n -x sea del otro, esta dada por la funcion de probabilidad hi¬ 
pergeometrica: 


r 




p(x\ N, k) 



10 


x = 0, 1, 2, .... n; x « k, n — x « N - k; 
AT, n , enteros positivos, (4.27) 


para cualquier otro valor 


Los parametros de la distribucidn hipergeometrica son N, n, y k. Estos definen 
una familia de distribuciones con funcidn de probabilidad determinada por (4.27). 
En la figura 4.3 se muestran algunas graficas de (4.27) para distintas combinaciones 
de N, n, y k. 

La funcion de probabilidad (4.27) de la distribucion hipergeometrica y la funcion 
de distribucidn acumulativa, definida por: 


P(X ^ x) = F(x-, N, n . k) 



(4.28) 


* Vease el capitulo siete para la definici6n de una muestra aleatoria. 
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FIGURA 4.3 Gr&ficas de la funcibn hipergeometrica de probabilidad 


se encuentra tabulada en [4] para valores de TV, n, y k desde TV = 2, n = 1 hasta TV 
= 100 y n = 50. Una parte de estas se encuentra en la tabla C del apendice. El calcu- 
lo de las probabilidades hipergeometricas puede convertirse en tedioso, especialmen- 
te si n es grande. Sin embargo, puede simplificarse si se emplea la siguiente formula 
de recursion, 


p(x + 1;TV, n, k) 


_ (n ~ x)(k - x ) _ 

(r + 1 )(N - k - n + x + 1) 


p(x\ N, n, k), 


(4.29) 


la cual se puede obtener directamente de la funcibn de probabilidad hipergeometrica. 


Ejemplo 4. 7 Supdngase que se tienen 50 representantes de cierto estado, a una con- 
vencibn politica nacional, de los cuales 30 apoyan al candidato A y 20 al candidato B. 
Si se seleccionan aleatoriamente cinco representantes, £cual es la probabilidad de 
que, entre estos cinco, por lo menos dos apoyen al candidato A? 

Sea X la variable aleatoria que representa el numero de personas en la muestra 
que apoyan a A. Para TV = 50, n = 5, y k = 30, la funcion de probabilidad de A'esta 
dada por: 


p(.v; 50, 5, 30) 



x = 0, I, .... 5, 


y la probabilidad de que X ^ 2 es: 


P(X 2= 2) = 1 - P(X =£ I) = 1 - [p(0;50, 5,30) + p{ 1; 50, 5,30)]. 
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Dado que: 


MO; 50, 5, 30) = 


30W20 
Oil 5 


:?) 


= 0.007317, 


y, de (4.29): 

Ml; 50, 5, 30) = 


(5 - 0)(30 - 0) 


MO; 50, 5, 30) = 0.068597, 


(0 + 1)(50 - 30 - 5 + 0 +1) 

se encuentra que: 

P(X& 2) = 1 - (0.007317 + 0.068597) = 0.9241. 


Un <irea muy fructifera en aplicaciones para la distribucidn hipergeometrica es 
el control estadistico de calidad y la aceptacidn de muestreo. En este contexto sea N el 
numero de unidades en un lote, de las cuales k se encuentran defectuosas. Si se selec- 
ciona una muestra aleatoria del lote formada por n < N unidades, la probabilidad 
de que la muestra contenga x unidades defectuosas se determina mediante el empleo de 
la funci6n hipergeometrica de probabilidad (4.27). En aceptacion del muestreo, la 
raz6n de que s61o se seleccione la muestra de un lote obedece m&s bien a restricciones 
de tiempo y dinero. La decisidn de cuando aceptar o rechazar un lote se basa, de ma¬ 
nera general, en el numero de articulos defectuosos encontrados en el. Estos concep- 
tos se tratar&n con gran detalle en el capitulo once. 


Ejemplo 4.8 Considerese un fabricante de automoviles que compra los motores a 
una compaflia donde se fabrican bajo estrictas especificaciones. El fabricante recibe 
un lote de 40 motores. Su plan para aceptar el lote consiste en seleccionar ocho, de 
manera aleatoria, y someterlos a prueba. Si encuentra que ninguno de los motores 
presenta serios defectos, el fabricante acepta el lote; de otra forma lo rechaza. Si el 
lote contiene dos motores con serios defectos, <,cual es la probabilidad de que sea 
aceptado? 

Sea X el numero de motores defectuosos en la muestra. Para N = 40, n = 8, y k 
= 2, la probabilidad de aceptacion es 


M0; 40, 8, 2) = 


De esta manera el lote 40 tiene una probabilidad menor de 2/3 de ser aceptado si 
contiene dos motores defectuosos. Debe notarse que la esencia del control 
estadistico de calidad es la mejoria de la calidad del producto. Si un vendedor sabe 
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que su producto pasarb por una selecci6n que verifica la calidad del producto, puede 
poner en marcha en su propia fbbrica un control de calidad intencionado con el pro- 
p6sito de minimizar el numero de lotes rechazados. Por lo tanto, es razonable supo- 
ner que esta prbctica darb como resultado un producto de calidad superior. 

iQufc pasa con la distribucibn hipergeometrica si el tamaflo de la muestra n es 
s61o una pequefla fraccibn de un lote de tamaflo Nrelativamente grande? Supbngase 
que se envia un lote de 2 mil unidades de las cuales 40 se encuentran defectuosas. Si 
se selecciona una muestra de 50, sin reemplazo, la probabilidad de que el primer ar- 
ticulo seleccionado se encuentre defectuoso es de 40/2 000 = 0.02. La probabilidad 
conditional de que el segundo articulo tambien se encuentre defectuoso dado que el 
primero lo fue, es 39/1 999 = 0.0195. A pesar de que estas probabilidades no tienen 
el mismo valor, puede argumentarse, desde un punto de vista practico, que la diferen- 
cia es insignificante. Es por esta razon que en muchas ocasiones se emplea la distri¬ 
bution binomial para aproximar a la distribucibn hipergeometrica cuando el cocien- 
te n/N es pequeflo. 

Si la proporcibn de articulos defectuosos en el lote es p = k/N, puede escribirse 
la funcibn de probabilidad hipergeometrica como: 


p H (x\ N, n, p) 



(V-?) 



(4.30) 


Puede demostrarse entonces que 

lim p H (x\ N, n, p) = p B (x; n, p). 


en donde p u {x\ n, p) es la funcibn de probabilidad binomial. De esta forma la 
distribution hipergeometrica tiende a la binomial con parametros n y p/k/N confor- 
me el Cociente n/N se vuelve mis pequeflo. De manera general, la funcibn de probabi¬ 
lidad binomial aproximarb de manera adecuada a (4.30) si se tiene que n < 0.1 N. 
En la tabla 4.6 se proporcionan algunas comparaciones entre las probabilidades bi¬ 
nomial e hipergeometrica conforme el cociente n/N disminuye. 

Ejemplo 4.9 Un fabricante asegura que solo el 1% de su produccion total se en- 
cuentra defectuosa. Supbngase que se ordenan 100 articulos y se seleccionan 25 al 
azar para inspeccionarlos. Si el fabricante se encuentra en lo correcto, i,cual es la 
probabilidad de observar dos o mas articulos defectuosos en la muestra? 

Sea X el numero de articulos defectuosos en la muestra. Entonces X es una va¬ 
riable aleatoria hipergeometrica con parametros N = 1 000, n = 25, y k = Np = 
(1 000)(0.01) - 10. Dado que el cociente n/N c s, de forma considerable, menor de 
0.1, puede emplearse la distribucibn binomial para aproximar la probabilidad deseada: 


P(X 3 = 2) = 1 - P(X =£ I) = I - /•„(!; 25, 0.01) = 0.0258. 
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TABLA 4.6 Comparacion entre los valores de probabilidad binomial o hipergeometrica 


X 

Hipergeometrica 
pit; 100, 20, 5) 

Binomial 
pit; 20, 0.05) 

Hipergeometrica 
pit; 100, 10, 5) 

Binomial 

pl.t; 10. 0.05) 

Hipergeometrica 
pit; 100, 5, 5) 

Binomial 

p(t; 5, 0.05) 

0 

0.3193 

0.3585 

0.5838 

0.5987 

0.7696 

0.7738 

i 

0.4201 

0.3774 

0.3394 

0.3151 

0.2114 

0.2036 

2 

0.2073 

0.1887 

0.0702 

Q.0746 

0.0184 

0.0214 

3 

0.0478 

0.0596 

0.0064 

0.0105 

0.0006 

0.0011 

4 

0.0051 

0.0133 

0.0003 

0.0010 

0.0000 

0.0000 

5 

0.0002 

0.0022 

0.0000 

0.0001 

0.0000 

0.0000 


en donde F 8 ( 1; 25, 0.01) es la funcidn de distribucidn acumulativa binomial. A 
continuation se analizara el proceso de decision para este problema. La probabili¬ 
dad de tener dos o mas articulos defectuosos en la muestra es muy pequefla. Supdn- 
gase que se observan dos o rods articulos defectuosos; entonces el proceso de decisidn 
relativo al lote debe hacerse con base en la probabilidad. Esto es, si se supone que las 
condiciones son verdaderas, se ha observado algo que s61o tenia una oportunidad de 
2.5% de ocurrir. Por otro lado, si la aseveracion del fabricante no es cierta y la pro¬ 
portion de articulos defectuosos es del 3%, entonces la probabilidad de observar dos 
o mas defectuosos es 

P(X^ 2) = 1 - F(l; 25, 0.03) = 0.1720, 

que es un valor mas plausible a la luz de la evidencia actual que es de 0.0258. De esta 
forma, si se observan dos o mas articulos defectuosos de entre los 25, se debe recha- 
zar el lote. 

Para determinar la media de la distribucidn hipergeometrica se sigue un procedi- 
miento analogo al empleado para la distribucion binomial. Si la funcidn de probabi¬ 
lidad esta dada por (4.27), 
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pero puede demostrarse que: 


o: 


Entonces: 


CMC4 


Nl 

(N - n)!n! 


N (N - 1 )! 
n (N - n)!(n - 1)! 


E(X) 



Si M = N - 1, r = k - 1 , s = n - 1 y y — x - 1 , 


w), % 2 

Jy v = 0 



nk 

N' 


(4.31) 


la suma es igual a uno dado que es la suma de una funcion de probabilidad hipergeo- 
metrica con parametros M, s, y r. Notese que si p = k/N, la media de la variable 
aleatoria hipergeometrica es la misma que la de la variable aleatoria binomial. 

Con el mismo procedimiento puede demostrarse que la varianza de una distribu- 
cion hipergeometrica es: 


Var(X) = 


nk(N - k) (N — n) 


N- 


Si p = k/N y (1 - p) = (N - k)/N, 

Var{X) = np(\ - p) 


(N 


N — n 


(4.32) 


ilV - I, 

La varianza de una variable aleatoria hipergeometrica es mas pequena que la corres- 
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pondiente a la variable aleatoria binomial por un factor de (N - n)/(N — 1). Sin 
embargo, si N es grande al compararse con n, este factor se encontrara cercano a 
uno, dando como resultado una varianza pricticamente igual a la binomial. El resul- 
tado anterior era de esperarse ya que si n es s61o una pequefta fraccibn de un lote de 
tamaflo N, la distribucibn hipergeometrica tiende a la distribucibn binomial. 

La determinacibn del coeficiente de asimetria y la curtosis relativa para la distri¬ 
bucibn hipergeometrica sigue el mismo procedimiento dado para la distribucibn bi¬ 
nomial. Estas cantidades se dan en la tabla 4.7. Nbtese que para N > 2, si N < 2k 
o si N < 2n, la distribucibn hipergeometrica se encuentra sesgada negativamente. 
Si N = 2k o si N = 2n, es simetrica. Si N > 2k y N > 2n, la distribucibn se 
encuentra sesgada positivamente. El lector puede consultar [2] para la funcibn gene- 
radora de momentos. Debe notarse que la funcibn generadora de momentos repre- 
senta un trabajo muy tedioso para determinar los momentos. La tabla 4.7 propor- 
ciona un resumen de la informacion mas importante para esta distribucibn. 


4.5 La distribucibn binomial negativa 

Sea un escenario binomial en que se observa una secuencia de ensayos independien- 
tes; la probabilidad de exito en cada ensayo es constante e igual a p. En lugar de fijar 
el numero de ensayos en n y observar el numero de exitos, supongase que se conti- 
nuan los ensayos hasta que han ocurrido exactamente k exitos. En este caso, la va¬ 
riable aleatoria es el numero de ensayos necesarios para observar k exitos. Esta si¬ 
tuation lleva a lo que se conoce como la distribucibn binomial negativa. 


TABLA 4.7 Propiedades basicas de la distribucion hipergeometrica 


Funcion de probabilidad Parametros 

p(x, N, n, k) yy, n f,' e nteros positivos 

\ n ) N = 1,2, ... 


x = 0, l, 2, ..., n 
x *£ k, n - x « N - k 


Media 

Varianza 

Coeficiente 
de asimetria 


Curtosis 

relativa 

nk 

nk(N - k)(N - n) 

(N - 2k)(N - 2 n)(N - 

1 )'/ 2 

* 

N 

N\N - 1) 

[N - 2)[nk(N - k)(N - 

n)}' n 



N'(N - I) 


(N - 2)(N - ~i)nk(N - k)(N - n ) 

(wv + 1) - 6 n(N - n) + 3 — 2 (N - k) lN'(n - 2) - /Vn : + 6 n(N - n )] 
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La determinacion de la funci6n de probabilidad sigue el mismo tipo de razona- 
miento empleado para obtener las funciones de probabilidad de las distribuciones 
binomial e hipergeometrica. Se desea determinar la probabilidad de que en el n- 
esimo ensayo ocurra el /c-esimo exito. Si se continuan los ensayos independientes 
hasta que ocurre el A:-esimo exito, entonces el resultado del ultimo ensayo fue exito. 
Antes del ultimo ensayo, habian ocurrido k -1 exitos en n -1 ensayos. El numero 
de maneras distintas en las que pueden observarse k - 1 exitos en n - 1 ensayos es: 
(1 - !)• Por lo tanto, la probabilidad de tener k exitos en n ensayos con el ultimo 
siendo un exito, es: 


p(rr, k, p) = 


(t - !) ' /(l - py 


n = k, k + 1, k + 2, ... . (4.33) 


La expresibn (4.33) es la funcibn de probabilidad de Io que se conoce como la 
distribucidn de Pascal. Mediante el empleo de (4.33) puede obtenerse la distribucion 
binomial negativa sustituyendo n = x + k en (4.33), en donde xes el valor de una 
variable aleatoria que representa el numero de fracasos hasta que se observan, de ma- 
nera exacta, k exitos. 


Definicibn 4.4 Sea X + k, el numero de ensayos independientes necesarios para 
alcanzar, de manera exacta, k exitos en un experimento binomial en donde la proba¬ 
bilidad de exito en cada ensayo es p. Se dice entonces que X es una variable binomial 
negativa con funcibn de probabilidad 


p{x] k, p) 


(k + .v 
\ k ~ 


X = 0, 1, 2, ... 

P k (\ ~ Pf k = 1,2,... 

0«p=£l, (4.34) 


10 


para cualquier otro valor 


La distribucion se llama “binomial negativa” debido a que las probabilidades 
dadas por (4.34) corresponden a los terminos sucesivos de la expansion binomial de: 

1 _ 1 ~ gV* 

P P I 

Los parametros de la distribucion binomial negativa son kyp,en donde k no ne- 
cesita ser un entero. Si es asi, la distribucion se conoce como distribucion de Pascal, 
misma que se interpreta como el tiempo que hay que esperar para que ocurra el k 
exito. Si k no es entero, la funcibn de probabilidad dada por (4.34) se escribe de ma¬ 
nera tal que se involucre a la funcibn gama, 


p(x\ k, p) = 


m + a ') 

r! r(jt) 


P k ( I ~ PY 


X = 0. 1,2. ... 
k > 0, 0 =£ p s; I. 


(4.35) 


En este contexto la distribucion binomial negativa es un caso particular de la distri- 
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buci6n de Poisson compuesta. Una distribucidn compuesta de una variable aleatoria 
X es aquella que depende de un parametro que a su vez es una variable aleatoria con 
una distribucion dada. En el capitulo seis se plantea este problema para la distribu- 
ci6n binomial negativa. 

Debe notarse que si k = 1 en (4.34), surge un caso especial de la distribucidn bi¬ 
nomial negativa, que se conoce con el nombre de distribucidn geom&trica y cuya 
funcion de probabilidad estd dada por 

p(x; p) = p{\ - p) x , x= 0,1,2 . 0< 1. (4.36) 

La variable aleatoria geometrica representa el numero de falias que ocunren antes de 
que se presente el primer exito. En la figura 4.4 se ilustran varias graficas de la fun¬ 
cion de probabilidad binomial negativa (4.34) para varios valores de k y p. 

En la referencia [6] se encuentra una extensa tabla de probabilidades individual y 
acumulativas para la distribucidn binomial negativa. Es posible emplear la distribu¬ 
cion binomial para obtener las probabilidades de la distribucidn binomial negativa. 
Puede demostrarse que si X es una variable aleatoria binomial negativa con funcidn 
de probabilidad dada por (4.34), entonces: 

P(X^x) = P(Y^ k), 

en donde Y es una variable aleatoria binomial con parametros n = k + x y p. Esto 
es: 

F nb (x;k,p)= 1 — F B (k ~ \;k + x, p), (4.37) 

en donde F NB (x\ k, p) es la distribucidn binomial negativa acumulativa y F H (k - 
1; k + x, p) es la distribucidn binomial acumulativa. Mediante el empleo de (4.37) 
puede determinarse las probabilidades individuates de la distribucidn binomial negati¬ 
va. Por ejemplo, 




FIGURA 4.4 Graficas de la funcion de probabilidad binomial negativa 
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P(X = x) = F nb (x; k, p) - F nb {x - 1; k, p) 

= [1 - F„{k - 1; k + x,p)} - [ 1 - F B (k - 1; k + x - l,p)] 

= Fdik - 1; k + x - l,p) - F B (k - 1 ;k + x,p). (4.38) 

Para ilustrar el uso de (4.37) y (4.34), sea k = 2 y p = 0.5 en (4.34): 
p NB (x; 2, 0.5) = (x+ l)(0.5) 2 (0.5r, x = 0, 1,2, ... . 

La probabilidad de que X =£ 3 es 

P(X ^ 3) = F nb ( 3; 2, 0.5) = 1 - F B { 1; 5, 0.5) = 0.8125; 
la probabilidad de que X = 2 es 

P(X = 2) = F s (l; 3, 0.5) - F*(l;4, 0.5) = 0.1875; 
y la probabilidad de que X > 1 es 

P(X > 1) = P(X & 2) = 1 - F NB ( 1; 2, 0.5) 
i j q • , = 1 - [1 - 7*^(1; 3, 0.5)] 

\ = 0.5. 

— V 

La aplicacion primaria de la distribucibn binomial negativa es una alternativa 
adecuada para el modelo de Poisson cuando la frecuencia de ocurrencia no es cons- 
tante sobre el tiempo o el espacio. Tambien se emplea de manera frecuente para mo 
delar las estadisticas de accidentes, datos psicologicos, compras del consumidor y 
otras situaciones similares en donde la frecuencia de ocurrencia entre grupos o indi- 
viduos no se espera que sea la misma. Por ejemplo, las estadisticas de accidentes au- 
tomovilisticos indican de manera consistente que los conductores jbvenes tienen 
mas accidentes que los de mis edad, y que los hombres tienen un mayor numero de 
accidentes que las mujeres. Desde este punto de vista no debe tomarse la distribucion 
binomial negativa en terminos de cuantos ensayos se necesitan para alcanzar un de- 
terminado numero de exitos. Mas bien, debe considerarse como el numero de 
ocurrencias en el tiempo o en el espacio cuando la frecuencia de estas no es constan- 
te. Para una aplicacion en particular, vease la referencia [1], 

Los momentos de una variable aleatoria binomial negativa pueden determinarse al 
obtener los momentos factoriales, como se hizo para las distribuciones binomial, de 
Poisson e hipergeometrica. Tambien es posible obtener la media, la varianza, el coe- 
ficiente de asimetria y la curtosis relativa a partir de las expresiones dadas por (4.4), 
(4.6) y (4.14) respectivamente. Puede demostrarse que si estas expresiones reempla- 
zan los parametros binomiales n, (1 - p) y p con las cantidades-£, \/p y — (1 -p)/p, 
respectivamente, se obtendran los momentos binomiales negativos deseados. De 
acuerdo con lo anterior, si X es una variable aleatoria binomial negativa con funcion 
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de probabilidad dada por (4.34): 


E(X) = —- 

P 

(4.39) 

„ ki I - p) 

Var(X) = 2 , . 

P 

(4.40) 

ai " [k(\ - p)] ,/2 ’ y 

(4.41) 

o , (P 2 ~ 6p + 6) 

“ < = 3+ w-p) ■ 

(4.42) 


En la tabla 4.8 se proporciona la information mas util para la distribution bino¬ 
mial negativa. A partir de esta tabla son evidentes algunas propiedades basicas de tal 
distribution. La varianza es mas grande que la media en forma permanente, asi 
como la distribucidn prescnta un sesgo positivo y es leptocurtica puesto que a 4 
siempre es mas grande que tres, pero a 4 —*• 3 conforme k —* *. 

Ejemplo 4.10 En un articulo de R. Pollard (vease la referencia [5]) se demuestra 
que el numero de anotaciones de seis puntos por equipo en el futbol colegial se des¬ 
cribe de manera apropiada mediante una distribucion binomial negativa. La tabla 
4.9 contiene information muy semejante a la que aparece en la tabla 4.3. Para deter- 
minar de manera teOrica la probabilidad de ocurrencia, es necesario tener estima- 
ciones de los valores de los parametros k y p. Dado que la media y la varianza de una 
variable aleatoria binomial negativa estan dadas por (4.39) y (4.40) respectivamente, 
se resuelve para k y p y se obtiene: 


E(X) 


E\X) 

P Var(X)' 

y 

~ Var(X) - E(X) ‘ 

TABLA 4.8 Propiedades basicas de la distribucion binomial negativa 

Funcion de probabilidad 


Parametros 

p(x\ k,p) = ^ + k X _ j p*( 1 - 

pY 

k, k > 0 (distribucion de Pascal si 
k es un entero positivo) 

jc = 0, 1, 2, ... 


p , 0 *£ p *£ 1 

Media Varianza 


Coeficiente Curtosis 

de asimelria relativa 

k( 1 - p) A(1 - p) 


2 - p (p 2 - 6p + 6) 

P P 2 


[All - p)} m + A(! - p) 
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TABLA 4.9 Distribution del numero de anotaciones de seis puntos por equipo y por juego 
en el futbol colegial, 1967 


Numero de 
anotaciones 

Numero 
de veces 
observadas 

Frecuencia 

relativa 

Probabilidad 

tedrica 

Numero 
esperado de 
ocurrencias 

0 

272 

0.1174 

0.1205 

279 

1 

485 

0.2094 

0.2117 

490 

2 

537 

0.2319 

0.2197 

509 

3 

407 

0.1757 

0.1754 

406 

4 

258 

0.1114 

0.1190 

276 

5 

157 

0.0678 

0.0722 

167 

6 

101 

0.0436 

0.0404 

94 

7 

57 

0.0246 

0.0212 

49 

8 

23 

0.0099 

0.0106 

25 

9 

8 

0.0035 

0.0051 

12 

10 

5 

0.0022 

0.0023 

5 

11 + 

6 

0.0026 

0.0019 

4 

Totales 

2316 

1.0000 

1.0000 

2316 


El metodo con que se calculan estos parametros* es la suposicion de que las esti- 
maciones de E(X ) y Var(X) son iguales a la media x y la varianza s 2 , muestral, mis- 
mas que tienen un valor de 2.58 y 3.79 respectivamente. De acuerdo con lo anterior, 
la estimacidn de p resulta ser 0.6807 y la de k, 5.5012. Puesto que esta ultima no es un 
entero, se emplea la funcidn de probabilidad dada por (4.35) para determinar las 
probabilidades tedricas. 

La diferencia aparente entre las distribuciones del numero de anotaciones por 
equipo entre la NFL y el futbol colegial se puede explicar en gran parte por la gran 
variabilidad que existe en la calidad de los oponentes en el futbol colegial cuando 
este se compara con la NFL. Como resultado, se espera que la frecuencia con la que se 
anotan seis puntos en el futbol colegial sea m&s una funcion del oponente de lo que 
es en la NFL. De esta manera es como se sugiere la distribution binomial negativa. 

Mediante un empleo directo de la definition, la funcion generadora de momen- 
tos de la distribution binomial negativa se obtiene de la siguiente manera: 


E(e ,x ) = 2 ^ 


x = 0 


k + x - 1 i * 


k - 1 


p\\ - p) x 


- 2 1(1 - PYY 


,-o (* - l)!x! 

P k + kp k [( 1 - p)e') + k(k " U 


2 ! 


P k tti - p)e'Y + 


* Vease el capitulo ocho, en particular la seccion 8.3.2 para la estimacion de parametros. 
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pero esta es la expansion binomial de 


1 (1 - P)e 

P / 


t~ 

; por lo tanto, la funcibn 


generadora de momentos esta dada por: 


m x (t) = 


[1 - (1 - p)eT 


(4.43) 


Con las distribuciones binomial, de Poisson, binomial negativa e hipergeometri- 
ca, se ha hecho un intento para proporcionar al lector distribuciones discretas de 
probabilidad que han demostrado ser modelos adecuados para muchos fenomenos 
inleresantes y utiles de manera practica. A pesar de que estas distribuciones son simi- 
lares entre si, cada una de ellas posee caracteristicas distintas que brindan al usuario 
la informacibn necesaria para una seleccion apropiada. Tambien debe notarse que si 
un fenomeno no presenta todas las propiedades de una distribucibn determinada es 
suficiente para excluirla como modelo de probabilidad adecuado para ese fenomeno 
aleatorio. 

Las distribuciones binomial, de Poisson y binomial negativa involucran ensayos 
de Bernoulli en el muestreo que se lleva a cabo con reemplazo. En la distribucibn bi¬ 
nomial el muestreo se lleva a cabo con un numero fijo de ensayos que tienen una 
probabilidad de exito o fracaso constante. En la distribucibn de Poisson el numero 
de ensayos es de tal manera infinito que la ocurrencia o no de un evento es constante 
en el tiempo y en el espacio. En la distribucibn binomial negativa, el muestreo se 
continua hasta observar un determinado numero de exitos y el numero de ensayos 
puede ser infinito. Por lo tanto, esta distribucibn es una alternativa factible de la de 
Poisson cuando la frecuencia de ocurrencia no es constante en el tiempo y el espacio. 
En la distribucibn hipergeometrica los ensayos no son independientes puesto que el 
muestreo se lleva a cabo sin reemplazo. No sblo el tamano de la muestra es fijo, sino 
que se supone que la poblacibn es finita y, muchas veces, relativamente pequena. 
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Ejercicios 


4.1. Sea X una variable aleatoria con distribution binomial y parametros n y p. Mediante la 
funci6n de probabilidad binomial, verificar que p(n - x\ n, 1 - p) = p(x\ n, p). 

4.2. En una distribucion binomial, sea X el numero de exitos obtenidos en diez ensayos don- 
de la probabilidad de exito en cada uno es de 0.8. Con el resultado del problema ante¬ 
rior, demostrar que la probabilidad de lograr de manera exacta seis exitos es igual a la 
probabilidad de tener cuatro fracasos. 

4.3. Mediante el empleo de la funcion de probabilidad binomial, verificar la siguiente formu¬ 
la de recursion: 


p(x + 1; p) 


(n - x)p 
(x + 1)(1 - p) 


p(x\ n, p). 


4.4. Sea X una variable aleatoria con distribuciOn binomial y parametros n = 8 y p = 0.4. 
Emplear la formula de recursion del problema anterior para obtener las probabilidades 
puntuales de los valores de X. Hacer una grafica de la funciOn de probabilidad. 

4.5. Sea X una variable aleatoria distribuida binomialmente con n = 10 y p = 0.5. 

a) Determinar las probabilidades de que X se encuentre dentro de una desviaciOn estan- 
dar de la media y a dos desviaciones estandares de la media. 

b) iComo cambiarian las respuestas de a) si n = 15 y p = 0.4? 

4.6. SupOngase que la probabilidad de tener una unidad defectuosa en una linea de ensamble 
es de 0.05. Si el numero de unidades terminadas constituye un conjunto de ensayos inde- 
pendientes: 

a) £Cu&l es la probabilidad de que entre 20 unidades dos se encuentren defectuosas? 

b) <;Cual es la probabilidad de que entre 20 unidades, dos como limite se encuentren de¬ 
fectuosas? 

c) iCu&l es la probabilidad de que por lo menos una se encuentre defectuosa? 


4.7. En una fabrica de circuitos electrOnicos, se afirma que la proporciOn de unidades defec¬ 
tuosas de cierto componente que esta produce, es del 5°/o. Un buen comprador de estos 
componentes revisa 15 unidades seleccionadas al azar y encuentra cuatro defectuosas. Si 
la compania se encuentra en lo correcto y prevalecen las suposiciones para que la distri¬ 
bution binomial sea el modelo de probabilidad adecuado para esta situacibn, ^cu41 es 
la probabilidad de este hecho? Con base en el resultado anterior ipuede concluirse que la 
compania esta equivocada? 

4.8. La probabilidad de que un satelite, despues de colocarlo en orbita, funcione de manera 
adecuada es de 0.9. Supongase que cinco de estos se colocan en orbita y operan de ma¬ 
nera independiente: 

a) iCual es la probabilidad de que, por lo menos, el 80% funcione adecuadamente? 

b) Responder a a) si n = 10 

c) Responder a a) si n = 20 

d) £Son inesperados estos resultados? <,P°r que? 

4.9. Con base en encuestas al consumidor se sabe que la preferencia de este con respecto a 
dos marcas, A y B, de un producto dado, se encuentra muy pareja. Si la opcion de 
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compra entre estas marcas es independiente, £cu61 es la probabilidad de que entre 25 
personas seleccionadas al azar, no mis de diez tengan preferencia por la marca A? 

4.10. Supbngase que un examen contiene 15 preguntas del tipo falso o verdadero. El examen 
se aprueba contestando correctamente por lo menos nueve preguntas. Si se lanza una 
moneda para decidir el valor de verdad de cada pregunta, £cual es la probabilidad de 
aprobar el examen? 

4.11. Un vendedor de seguros sabe que la oportunidad de vender una p61iza es mayor mientras 
mis contactos realice con clientes potenciales. Si la probabilidad de que una persona 
compre una poliza de seguro despues de la visita, es constante e igual a 0.25, y si el con- 
junto de visitas constituye un conjunto independiente de ensayos, icuantos comprado- 
res potenciales debe visitar el vendedor para que la probabilidad de vender por lo menos 
una poliza sea de 0.80? 

4.12. El gerente de un restaurante que solo da servicio mediante reservation sabe, por expe- 
riencia, que el 15% de las personas que reservan una mesa no asistirin. Si el restaurante 
acepta 25 reservaciones pero solo dispone de 20 mesas, icual es la probabilidad de que a 
todas las personas que asistai. al restaurante se les asigne una mesa? 

4.13. Mediante la probabilidad de Poisson, demostrar la siguiente formula de recursion: 

p(x + 1; X) = - A — p(x\ X). 

(x + 1) 

4.14. Sea X una variable aleatoria de Poisson con parametro X = 2. Emplear la fbrmula del 
problema anterior para determinar las probabilidades puntuales de X = 0, 1, 2, 3, 4, 5, 
6, 7 y 8, y hagase una grafica de la funcion de probabilidad. 

4.15. Para un volumen fijo, el numero de celulas sanguineas rojas es una variable aleatoria 
que se presenta con una frecuencia constante. Si el numero promedio para un volumen 
dado es de nueve celulas para personas normales, determinar la probabilidad de que el 
numero de celulas rojas para una persona se encuentra dentro de una desviacibn estan- 
dar del valor promedio y a dos desviaciones estandar del promedio. 

4.16. El numero de clientes que llega a un banco es una variable aleatoria de Poisson. Si el nu¬ 
mero promedio es de 120 por hora, £cu41 es la probabilidad de que en un minuto Ueguen 
por lo menos tres clientes? ^Puede esperarse que la frecuencia de llegada de los clientes 
al banco sea constante en un dia cualquiera? 

4.17. Supongase que en un cruce transitado ocurren de manera aleatoria e independiente dos 
accidentes por semana, Determinar la probabilidad de que ocurra un accidente en una 
semana y de que ocurran tres, en la semana siguiente. 

4.18. Sea X una variable aleatoria binomial. Para n = 20, calcular las probabilidades pun¬ 
tuales binomiales y compararlas con las correspondientes probabilidades de Poisson 
para p = 0.5, 0.3, 0.1 yO.Ol. 

4.19. Una compania compra cantidades muy grandes de componentes electronicos. La deci¬ 
sion para aceptar o rechazar un iote de componentes se toma con base en una muestra 
aleatoria de 100 unidades. Si el lote se rechaza al encontrar tres o mas unidades defec- 
tuosas en la muestra, ^cual es la probabilidad de rechazar un lote si este contiene un 1% 
de componentes defectuosos? <,Cual es la probabilidad de rechazar un lote que contenga 
un 8% de unidades defectuosas? 
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4.20. El numero de componentes que fallan antes de cumplir 100 horas de operaci6n es una 
variable aleatoria de Poisson. Si el numero promedio de estas es ocho: 

a) iCual es la probabilidad de que falle un componente en 25 horas? 

b) iCual es la probabilidad de que fallen no mils de dos componentes en 50 horas? 

c) iCual es la probabilidad de que fallen por lo menos diez en 125 horas? 

4.21. Mediante estudios recientes se ha determinado que la probabilidad de morir por causa 
de cierta vacuna contra la gripe es de 0.00002. Si se administra la vacuna a 100 mil perso¬ 
nas y se supone que estas constituyen un conjunto independiente de ensayos, £cual es la 
probabilidad de que mueran no mils de dos personas a causa de la vacuna? 

4.22. Un fabricante asegura a una compaflia que el porcentaje de unidades defectuosas es de 
s61o dos. La compaflia revisa 50 unidades seleccionadas aleatoriamente y encuentra cin- 
co defectuosas. iQue tan probable es este resultado si el porcentaje de unidades defec¬ 
tuosas es el que el fabricante asegura? 

4.23. El numero de accidentes graves en una pla..ta: '.dustrial es de diez por afio, de manera 
tal que el gerente instituye un plan que considera efectivo para reducir el numero de ac¬ 
cidentes en la planta. Un aflo despues de ponerlo en marcha, solo han ocurrido cuatro 
accidentes. iQue probabilidad hay de cuatro o menos accidentes por aflo, si la frecuen- 
cia promedio aun es diez? Despues de lo anterior, ^puede concluirse que, luego de un 
aflo, el numero de accidentes promedio ha disminuido? 

4.24. El Departamento de Protection del Ambiente ha adquirido 40 instrumentos de preci¬ 
sion para medir la contamination del aire en distintas localidades. Se seleccionan aleato¬ 
riamente ocho instrumentos y se someten a una prueba para encontrar defectos. Si 
cuatro de los 40 instrumentos se encuentran defectuosos, icual es la probabilidad de que 
la muestra contenga no mas de un instrumento defectuoso? 

4.25. Se sospecha que por causa de un error humano se han incluido en un embarque de 50 uni¬ 
dades, dos (o mas) defectuosas. El fabricante admite el error y envia al cliente solo 48 
unidades. Antes de recibir el embarque, el cliente selecciona aleatoriamente cinco uni¬ 
dades y encuentra una defectuosa. <,Debe reclamar una indemnizacion al fabricante? 

4.26. Los jurados para una corte federal de distrito se seleccionan de manera aleatoria entre 
la lista de votantes del distrito. En un determinado mes se selecciona una lista de 25 can- 
didatos. fista contiene los nombres de 20 hombres y cinco mujeres. 

a) Si la lista de votantes se encuentra igualmente dividida por sexo. 6 cu£l es la probabili¬ 
dad de tener una lista que contenga a 20 hombres y cinco mujeres? 

b) Supongase que de esta lista se elige un jurado de doce personas, de las cuales solo 
una es mujer. <,Cual es la probabilidad de este hecho, si los iniembros del jurado se 
seleccionan de manera aleatoria? 

c) Si el lector fuera el abogado de la defensa, £que podria argumentar mediante el 
empleo de las respuestas de las partes a y b'! 

4.27. Una compaflia recibe un lote de 1 000 unidades. Para aceptarlo se seleccionan diez uni¬ 
dades de manera aleatoria, y se inspeccionan. Si ninguna se encuentra defectuosa, el 
lote se acepta; de otro modo, se rechaza. Si el lote contiene un 5°7o de unidades defec¬ 
tuosas: 

a) Determinar la probabilidad de aceptarlo mediante el empleo de la distribution hiper- 
geometrica. 
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b) Aproximar la respuesta de la parte a mediante el empleo de la distribuci6n binomial. 

c) Aproximar la respuesta de la parte b mediante el empleo de la distribucibn de Pois¬ 
son. 

4.28. En el ejercicio anterior, £c6mo cambiarian las respuestas de las partes a, b y c si el tama- 
iio del lote fuera de 40 unidades? 

4.29. Considerese las funciones de probabilidad binomial y binomial negativa dadas por las 
expresiones 4.1 y 4.34, respectivamente. Demostrar que: 

k 

p SB (x\ k , p) = —— p B (k\ x + k, p). 
x + k 

4.30. Sea X una- variable aleatoria binomial negativa con parametros k = 3 y p = 0.4. 
Emplee el resultado del problema anterior para calcular las probabilidades puntuales 
para los siguientes valores de X: 0, 1, 2, 3, 4 y 5. 

4.31. Greenwood y Yule* dieron a conocer el numero de accidentes ocurridos entre 414 ope- 
radores de maquinaria, en un periodo de tres meses consecutivos. En la tabla4.10 la pri- 
mera columna indica el numero de accidentes sufridos por un mismo operador, y la 
segunda indica la frecuencia relative para aquellos que habian sufrido la cantidad de ac¬ 
cidentes indicada en el lapso de tres meses. 


TABLA 4.10 


x Frecuencia 
relaliva 


0 

0.715 

1 

0.179 

2 

0.063 

3 

0.019 

4 

0.010 

5 

0.010 

6 


7 

0.000 

8 

0.002 


Con el procedimiento del ejemplo 4.10, comparar las frecuencias relativas observadas 
con las correspondientes probabilidades si el numero de accidentes es una variable alea¬ 
toria binomial negativa. 

4.32. Un contador recientemente graduado pretende realizar el examen CPA. Si el numero de 
veces que se hace el examen constituye un conjunto de eventos independientes con una 
probabilidad de aprobar igual a 0.6, £cual es la probabilidad de que no se necesiten mas 
de cuatro intentos para aprobar el examen? ^Son validas las suposiciones de independen- 
cia y probabilidad constante? 


* Encuesla acerca de la dislribucion represenlaliva de la frecuencia de multiples eventos, con especial re¬ 
ferenda a la ocurrencia de multiples ataques de enfermedades o accidentes repetidos, J. ot the Royal Sta¬ 
tistical Soc. 83 (1920), 255. 
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4.33. En un departamento de control de calidad se inspeccionan las unidades terminadas que 
provienen de una linea de ensamble. Se piensa que la proporcidn de unidades defec- 
tuosas es de 0.05. 

a) iCual es la probabilidad de que la vigesima unidad inspeccionada sea la segunda que 
se encuenre defectuosa? 

b) Supbngase que la decimo quinta unidad inspeccionada es la segunda que se encuen- 
tra defectuosa. iCual es la probabilidad de este hecho bajo condiciones determina- 
das? 

4.34. De las distribuciones binomial, Poisson, hipergeometrica y binomial negativa, icuales 
no consideraria si alguien le dijera, de una distribution en particular que: 

a) j,La media es igual a la varianza? 

b) iLa media es mas grande que la varianza? 

c) iLa media es menor que la varianza? 

d) El tercer momento, alrededor de la media, £es negativo? 

e) iEl fenomeno aleatorio de interes constituye un grupo de ensayos independientes? 

f) <,E1 muestreo se Ueva a cabo con reemplazo? 

g) iEl muestreo se lleva a cabo sin reemplazo? 


APENDICE 

Deduction de la funcidn de probabilidad de Poisson 

Sea p(x ; t) la probabilidad de tener, de manera exacta, X ocurrencias en un interva- 

lo t, y supbngase lo siguiente: 

1. En este intervalo, los eventos ocurren de manera independiente. 

2. La probabilidad de una sola ocurrencia, en un intervalo muy pequeflo dt es vdt, 
en donde v es la frecuencia constante de ocurrencia y {v > 0). 

3. El intervalo dt es tan pequeno, que la probabilidad de tener mas de una ocurren¬ 
cia en dt es despreciable. 

El evento que en el tiempo t + dt ha ocurrido exactamentex veces, puede llevarse a 

cabo de dos maneras diferentes y excluyentes: 

1. Existen x ocurrencia por tiempo t, con probabilidad p(x\ t) y ninguna en dt, con 
probabilidad (1 - vdt). Dada la suposicion de independencia, la probabilidad 
conjunta es p(.v; /)(! - vdt). 

2. Existen x - 1 ocurrencias por tiempo t, con probabilidad p(x - 1; /) y una du¬ 
rante dt, con probabilidad vdt. Otra vez, dada la suposicion de independencia, la 
probabilidad conjunta es: p(x - 1; l)vdt. 

Esto es: 


p(x\ t + dt) - p(.v; r)(l - vdt) + p(x - 1; t)vdt. 
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Despues de multiplicar, transportar p(x ; /) al primer miembro, y dividir por dt, se 
tiene: 


p(x ; t + dt) - p(.r; t) 
dt 


= v[p(x - 1; t) - p(x; /)]. 


Si se toma el limite conforme dt —> 0, por definicibn se tiene: 
dp(x\ t) 


dt 


v[p(x - 1; /) - p(x\ 0], 


(4.44) 


que es una ecuacibn diferencial lineal con respecto a t y una ecuacion de diferencias 
finitas de primer orden, con respecto a x. Si x = 0, la ecuacion (4.44) se convierte en 


dpi 0; t) 
dt 


= v[p{- 1; t) - p{ 0; 01 


= -vp(0\t), 

dado que p( - 1;/) tiene que ser cero. La solucion general de la ecuacion diferencial 
lineal 


dpi 0; t ) 
dt 


- vp{ 0; /) 


se obtiene mediante separacion de variables e integracion en ambos miembros, lo 
que da como resultado: 

ln[p(0; /)] = ln(c) - vt. 


o 

Pi 0; t) = ce-" 

Dado que la probabilidad de tener cero ocurrencias en un intervalo t = 0, debe ser 1, 
c = 1, y 


P(0; /) 


Si x = 1, (4.44) se convierte en 
dpi 1; t ) 


dt 


= v[p( 0; /) - pi 1; /)], 


+ vpi\-t) = ve-*' (4.45) 

dt 

La ecuacion (4.45) es una ecuacion diferencial no homogenea con la condicion ini- 
cial de que pi 1; 0) = 0 dado que la probabilidad de tener exactamente una 
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ocurrencia en / = 0 debe ser cero. La solucibn de (4.45) es 

P(l; /) = {vt)e— 

De manera similar, para x = 2 y p( 2; 0) = 0, (4.44) se reduce a 

■ </p(2; /) 


dt 


+ vp{2\ t) = v te~ vt . 


cuya solucibn es 


P( 2; /) = 


(»*)<? 


2„-w 


2 ! 


A1 continuar este proceso puede deducirse que la probabilidad de tener exactamente 
x ocurrencias en t es 


p(x; t) = 


(vt)'e 


x'. 


x = 0, 1,2, ... 


(4.46) 


siempre que p(x\ 0) = 0. Si se sustituye A = vt en (4.46), el resultado es la fun- 
ci6n de probabilidad de Poisson. 


APENDICE 

Demos tracibn del teorema 4.1 

A1 multiplicar numerador ydenominador por n' ysustituir n\/(n - ,v)! = n(n 
l)(n - 2)•••(« - x + I), la funcibn de probabilidad binomial es: 

, x n{n - \)(n — 2) ••• (n — x + I) „ /t 
p(x\ n, p) =-—--- —(np)( 1 - p) 


n x\ 


n(n - \)(n - 2) ••• (n — x 4- DA" 1 
~n* xl 


(1 - p) H ~ x 


= KI- 

/i 


-,r 

n / ,r! 


Dado que: 


i ") (i ~ 


x - I 


(I - pY 


n 7 A 1 

-d ~ PT. 

x\ 


(l - P y = 1(1 - p)-'"’}- np = [(l - P ) 


- 1/(11 -X 


y por definicion: 


lim (1 + z) Uz = e, 


(4.47) 
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mediante el cambio de variable z = -p, se tiene 


lim [(1 - P r' /p ]-' = e~\ 
P-* o 


Adem&s, 


lim 


H)R 


1 - 


x - 1 


= 1 


lim (1 - p) x = 1. 

P— o 


A1 sustituir en (4.47), 


e l '\ x 

iim p(x; n,p) = ——x = 0, 1, 2, .. 
— jt! 


//—*x 
p—0 
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CAPITULO CINCO 


Algunas distribuciones 
continuas de probabilidad 


5.1 Introduction 

Estas distribuciones se emplearon en el estudio de fenomenos aleatorios en discipli- 
nas como la ingenieria y las ciencias aplicadas o bien los negocios y la economia. En 
este capitulo se desarrollara un metodo para determinar la distribucion de probabili¬ 
dad de una funcion de variable aleatoria y se introduciran los conceptos basicos para 
la generation, por computadora, de numeros aleatorios. 

De manera especifica se estudiaran los siguientes modelos de probabilidad: nor¬ 
mal, uniforme, beta, gama, de Weibull y exponential negativa. La forma de abordar 
los temas sera la misma que se empleo en el capitulo cuatro. Se discutiran las pro- 
piedades de cada modelo y se indicaran areas de aplicacion especifica, con lo que se 
pretende proporcionar al lector una idea y comprension suficiente para utilizar los 
modelos de manera apropiada. 


5.2 La distribution normal 

La distribucion normal o Gausiana es indudablemente la mas importante y la de ma¬ 
yor uso de todas las distribuciones continuas de probabilidad. Es la piedra angular 
en la aplicacion de la inferencia estadistica en el analisis de datos, puesto que las 
distribuciones de muchas estadisticas muestrales tienden hacia la distribucion nor¬ 
mal conforme crece el tamano de la muestra. La apariencia grafica de la distribucion 
normal es una curva simetrica con forma de campana, que se extiende sin limite 
tanto en la direction positiva como en la negativa. Un gran numero de estudios indi- 
ca que la distribucion normal proporciona una adecuada representation, por lo me- 
nos en una primera aproximacion, de las distribuciones de una gran cantidad de va¬ 
riables fisicas. Algunos ejemplos especificos incluyen datos meteorologicos tales 
como la temperatura y la precipitation pruvial, mediciones efectuadas en organis- 
mos vivos, calificaciones en pruebas de actitud, mediciones fisicas de partes manu- 
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facturadas, errores de instrumentacidn y otras desviaciones de las normas establed- 
das, etc. Sin embargo, debe tenerse mucho cuidado al suponer para una situacion 
dada un modelo de probabilidad normal sin previa comprobacion. Si bien es cierto 
que la distribucidn normal es la que tiene un mayor uso, es tambien de la que mas se 
abusa. Quiza esto se deba a la mala interpretation de la palabra “normal”, especial- 
mente si se aplica su significado literal de “patron o estandar aceptado”. Suponer de 
manera erronea una distribucidn normal puede llevar a errores muy serios. Es po- 
sible que una distribucidn normal proporcione de manera razonable una buena 
aproximacion alrededor de la media de una variable aleatoria; sin embargo, puede 
resultar para valores extremos que se encuentren en cualquier direccidn. Por 
ejemplo, si se disefta cierto material para resistir una cantidad dada de presion, que 
se supone se encuentra distribuida normalmente alrededor de un valor promedio, y 
el disefio se hace con base en esta suposicion, el material puede verse seriamente da- 
ftado al aplicarsele una presion muy elevada. 

En la definicion 5.1 se proporciona la funcion de densidad de probabilidad de la 
distribucidn normal, la cual fue descubierta por DeMoivre en 1733 como una forma 
limite de la funcion de probabilidad binomial; despues la estudio Laplace. Tambien 
se conoce como distribucidn Gausiana porque Gauss la cito en un articulo que 
publico en 1809. Durante el siglo xix se empleo de manera extensa por cientificos 
que habian notado que los errores, al llevar a cabo mediciones fisicas, frecuentemen- 
te seguian un patron que sugeria la distribucidn normal. 

Definicion 5.1 Se dice que una variable aleatoria X se encuentra normalmente 
distribuida si su funcion de densidad de probabilidad esta dada por 

fix: ju, cr) = —exp 
\2n cr 

Los parametros de la distribucidn normal son ix y a y ademas determinan de 
manera completa la funcion de densidad de probabilidad. Como se vera posterior- 
mente, estos parametros son la media y la desviacion estandar de X, respectivamen- 
te. En la flgura 5.1 se proporcionan varias graficas de (5.1) para distintos valores de 
lx a tr fijo y viceversa. 

Es obvio que para cualquier par de valores /x y o-,(5.1)es simetrica y tiene forma 
de campana. Si se obtienen las dos primeras derivadas de fix: /x, cr) con respecto a 
x y se igualan a cero, se tiene que el valor maximo de /(.r, /x, cr) ocurre cuando x = 
M. y los valores x = m ± cr son las abcisas de los dos puntos de inflexion de la 
curva. En un apendice al final de este capitulo se proporciona la demostracion de 
que (5.1) es una funcion de densidad de probabilidad. 

La media de una variable aleatoria distribuida normalmente se encuentra defini- 
da por: 


1 x — fX 

2 \ cr 


oc < r < 


E{X) = 




.vexpl -(.v - ixY/2<f]dx. 


(5-2) 
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p = 0 x 


F1GURA 5.1 Graficas de la funcion de densidad normal para diferentes valores de m y o' 

Se pretende demostrar que E(X) = p. Supdngase que a (5.2) se suma y se resta 

—7==— f exp[-(jr - p) 2 /la 2 ]dx. 

\j2it a -x 

La identidad se mantiene, pero despues de reacomodar terminos se tiene 

E(X) = ■ — I (x - /it)exp[-(jr - fi) 2 /2a 2 ]dx 
\Z2tt a J * 

+ - ~ f exp[-(.v - p) : /2cr 2 ]dx 
\2tt a J x 

= —f =— I (.v - /u)exp[-(.v - p) 2 /2cr 2 ]dx + p, (5.3) 

2tt cj ~ T 
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dado que el valor de la segunda integral es uno. A1 efectuar un cambio de variable de 
integracion en (5.3) de manera tal que y = (x - fx)/a, x = ay + p., y dx = a 
dy, se tiene: 


e(x)=^= r 


ye\p(-y 2 /2)dy + p 


= — i==exp(-y 2 /2) 
\2tt 


+ p = p. 


(5.4) 


El lector recordara de sus cursos de calculo que la ultima integral es cero porque 
el integrando es una funcion impar* y la integracion se lleva a cabo sobre un interva- 
lo simerico alrededor de cero. 

Una distribucion normal es simetrica alrededor de su media tx. Si el valor maxi- 
mo de la funcion de der^idai de probabilidad normal ocurre cuando x = fi, p ps la 
media, la mediana y la moda de cualquier variable aleatoria distribuida normalmente. 

Para encontrar los demas momentos, se determinara la funcion generadora de 
momentos. Por definition: 

m x ^^(t) = = —X = — f expuu - ju)]exp[-(.r - fi) 1 /2a 2 ]dx 

\2tt ct j x 

■ = /— exp { ~?p lu - ^ 


2cr 2 t(x - /Lt)] \dx. 


Se completa el cuadrado en el interior del parentesis rectangular y se tiene: 


U - p) 2 - 2 ar 2 t(x — p) = (x - p) 2 - 2Or 2 t(x - fl) + or 4 / 2 - or 4 / 2 

= (x - p - cr 2 t) 2 - cr 4 / 2 

m X -^(t) = —=— | exp(o- 2 / 2 /2)exp{-[x - (p + a 2 t)] 2 /2a 2 }dx 

\Z2tt cr •'-* 


= exp(o- 2 / 2 /2) 




— [jc - (/u. + cr 2 /)] 2 / 2<r 2 }dx 


= exp(cr 2 r/2), (5.5) 

dado que el integrando junto con el factor l/\/2i t a es una funcion de densidad de 
probabilidad normal con parametros p + cr 2 t y cr. 

A1 desarrollar (5.5) en serie de potencias se tiene: 


= 1 + 


Urt) 2 (at) 4 (at) 6 (at)* 

2 + 4-2! + 8-3! + 16-4! 


+ ••• . 


* Se dice que una funcion f(x) es impar si f{ -x) = -/(.r). Entonces /" „/(»)</. v = 0. Se dice que una 
funcion f(x) es par si /(- x) = J\x). Entonces 5“- u f(x)dx = 2 {" t f(x)dx. 
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Cuando las potencias impares de / no se encuentran presentes, todos los momentos 
centrales de X de orden impar son cero, de esta forma se asegura la simetria de la 
curva. 

La segunda derivada de m x . ll .(t) evaluada en t = 0 es la varianza y esta dada 
por: 


Var(X) = 


d 2 m X - l At) 
dt 2 



12/V 30/ V 6 

+ - + ' *** 

4-2! 8-3! 



(5.6) 


de esta manera la desviacion estandar es <x. De manera similar, la cuarta derivada de 
m x _ f± (t) evaluada en / = 0 es el cuarto momento central, el cual es: 


d*m X - (t) 

^ = ~dF- 


, 4 360/V 6 

= V + -¥JT + 


= 3<t 4 


(5.7) 


<=o 


De acuerdo con lo anterior, para cualquier distribucion normal el coeficiente de 
asimetria es a 3 (X) = 0, mientras que la curtosis relativa es a AX) = 3rr 4 /<r 4 = 3. 
Para momentos alrededor del cero, puede determinarse la funcion generadora de 
momentos de X mediante el empleo directo de la funcion generadora de momentos 
centrales (o viceversa). Dado que 

mx-A) = E[e' (X ^] 

= exp(-/i/)E[exp(/A')] 

= exp(-pi t)m x (t), 

para una distribucion normal 

exp(-p.t)m x (t) - exp(a 2 / 2 /2) 

y 

m x {t) = exp^u/ + . (5.8) 

La probabilidad de que una variable aleatoria normalmente distribuida X sea 
menor o igual a un valor especifico, x esta dada por la funcion de distribucion acu- 
mulativa 


P(X < x) = F{x\ p, a) 


i r 

7 t r i t J ~ 


\J1tt 


exp| -(/ - pLy/2cr 2 ]dl. 


(5.9) 


La integral en (5.9) no puede evaluarse en forma cerrada; sin embargo, se puede ta¬ 
bular F(x\ p, a ■) como una funcion de M y lo que necesitaria una tabla para 
cada par de valores. Como existe un numero infinito de valores de p. y <r, esta tarea 
es virtualmente imposible. Afortunadamente, lo anterior puede simplificarse me¬ 
diante el empleo de la siguiente transformacion: sea Z una variable aleatoria defini- 
da por la siguiente relacion: 
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Z = (X - n)/a, (5.10) 

en donde cr son la media y la desviacion estandar de X, respectivamente. De 
acuerdo con lo anterior, Z* es una variable aleatoria estandarizada con media cero y 
desviacion estandar uno, de acuerdo con lo que se discutio en el capitulo tres. 

Si la transformation (5.10) se sustituye en (5.9), entonces: 

P(X < x) = P\Z < (x - M )/o-J = -L- 

\ 2 7 T cr 

(\ y 

exp(-z 2 /2 )dz. (5.11) 

— x 

El integrando en (5.11) junto con el factor \/\/2v es la funcion de densidad de 
probabilidad de la variable aleatoria normal estandarizada Z. Esto es, si X se en- 
cuentra normalmente distribuida con media m y desviacion estandar cr, entonces 
Z = (X - n)/cr tambien se encuentra normalmente distribuida con media cero y 
desviacion estandar uno. Asi, para z = (x - /a)/ a, P(X < x) = PiZ. sz) y 

F x (x\ fi, cr) = F z (z; 0. 1), (5.12) 

donde F z (z; 0, 1) es la funcion de distribucion acumulativa de la funcion de pro¬ 
babilidad normal estandarizada. En la figura 5.2 se proporciona la grafica de la 
funcion de distribucion para la variable aleatoria normal estandarizada. 

* Se empleara Z para denotar una variable aleatoria normal estandarizada. 



I 


iX-fA )/<T 


exp( - z 2 /2)(crf/z) 


Fit) 



FIGERA 5.2 Funcion de distribucion acumulativa de la normal estandar 
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La funcion F z {z\ 0, 1) se encuentra tabulada, de manera extensa, y se da en la 
tabla D del apendice. Para cualquier valor especlfico de z, el correspondiente valor 
en la tabla es la probabilidad de que la variable aleatoria normal estandar Z sea me- 
nor o igual a z\ esto es, 

P{Z < z) = F z (z\ 0, 1) = 

ylir 




exp( - t 2 /2)dt. 


(5.13) 


En este momento es conveniente introducir la notacion X ~ N(p, a) para denotar 
que la variable X se encuentra distribuida normalmente con media p y desviadon estandar 
cr. En lo que sigue se examinara como puede determinarse la probabilidad de que un 
valor de X se encuentre entre a y b, si X ~ N(p, cr) . Por definicion: 


1 f* 

P{a < X < b) = — -= — exp[ - (jc - p.f/2<r 2 ]dx, 

\ rl'TT rr Ja 


\j2it cr ■ 

pero, mediante el empleo de (5.3) se tiene: 

P(a < X ^ b) = p(-—^- sZs ^ 

\ cr cr 

r(h-fi)/tr 


J 'lh- ti)/(T 

exp(-z 2 /2)dz 

(«-u )/a 


\Z2tt 

= C z (——^-;0, I) - 0, , |. 


(5.14) 


En otras palabras, la probabilidad de que X este entre a y b es, de manera exacta, la 
misma probabilidad de que Z se encuentre entre {a - p)/u y (b - p)/cr, en don- 
de Z es N( 0, 1). En la figura 5.3 se ilustra esta correspondence de probabilidades. 
Se ilustrara el empleo de la tabla D mediante los siguientes ejemplos. 


Ejemplo 5.1 Si X es Nip,a), icuales son las probabilidades de que el valor de X 
se encuentre a una, dos y tres veces la desviadon estandar de la media? 


Pi p — <j < X s p + cr) 


F 


F 


p + cr — p 


cr cr 

= Pi - I < Z < 1) 

= F z ( 1;0, I) - F z ( — 1; 0, I) 


= 0.6826. 

Pip - 2cr < X < p + 2<r) = P(~2 < Z < 2) 

= F z i 2;0, 1) - F z i -2; 0, 1) = 0.9544. 
Pip - 3cr < X < p + 3<r) = Pi - 3 < Z < 3) 

= F z i 3;0, I) - F z (-3;0, 1) = 0.9974. 
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FIGURA 5.3 Correspondencia entre las probabilidades de X y de Z 


Asi, para cualquier variable aleatoria normal las probabilidades “una sigma”, “dos 
sigma” y “tres sigma” son 0.6826, 0.9544 y 0.9974 respectivamente. Este resultado 
indica que para la distribucion normal existe una gran concentration de valores alre- 
dedor de la media. 

Ejemplo 5.2 Sea X una variable aleatoria que representa la inteligencia medida por 
medio de pruebas Cl. Si X es N(100, 10), obtener las probabilidades de que X sea 
mayor que 100, menor que 85, a lo mas 112, por lo menos 108, mas grande que 90, y 
entre 95 y 120. 

Debe notarse que al resolver problemas de esta clase, el lector puede encontrar de 
gran ayuda graficar las correspondientes areas bajo las curvas de densidad normal, 
como se ilustra en la figura 5.3. Dado que la distribucion de probabilidad de X es si- 
metrica alrededor de su media, la probabilidad de que X sea mayor que este valor es, 
por definition, 0.5. Las otras probabilidades se obtienen de la siguiente forma: 

/ 85 - 100) 

P(X < 85) = Plz <--- 1 = P(Z< - 1.5) 

= FA- 1.5; 0, 1) = 0.0668. 

P(X < I 12) = />(Z< 1.2) = FA 1.2;0, 1) = 0.8849. 
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P(jr> 108) = P(Z> 0.8) = I - F z (0.8;0, 1) = 0.2119. 

P(X > 90) = P(Z> -1) = 1 - F z (- 1; o, 1) = 0.8413. 

P(95 < 120) = P(-0.5 <Z< 2) = F z (2; 0, 1) - F z (-0.5;0, I) = 0.6687. 


Ejemplo 5.3 Supongase que la demanda mensual de cierto producto se encuentra 
aproximada por una variable aleatoria normal con media de 200 y desviacion estan- 
dar igual a 40 unidades. ^Que tan grande debe ser el inventario disponible a principio 
de un mes para que la probabilidad de que la existencia se agote no sea mayor de 
0.05? 

Sea X la demanda mensual, entonces X es jV( 200, 40). Lo que se desea obtener 
es el valor del cuantil jc 0 95 para el nivel de inventario a principio del mes, de manera 
tal que la probabilidad de que la demanda exceda a x 0 95 (existencias agotada) no sea 
mayor de 0.05. Esto es: 


P(X > x 0 95 ) = 0.05 


o 

; P{X < x 0 95 ) = 0.95. 


De lo anterior se sigue que: 

P[Z < (jc 0 95 - 200)/40] = 0.95 


o 

P(Z<z 0 . 95 ) = FAzo.95-,0, 1) = 0.95, 


donde Z 0.95 = (* 0.95 _ 200)/40 es el valor cuantil correspondiente a la variable aleato¬ 
ria normal estandar. Para obtener z 0 . 95 de la tabla D, primero se busca la probabili¬ 
dad mas cercana a 0.95. Una vez que se encuentra este valor, se toman los corres- 
pondientes valores del renglon y la columna y se interpola para encontrar el valor 
deseado de z 0 . 95 . Por ejemplo, Z0.95 tiene un valor aproximado de 1.645 y dado que 
Z 0.95 = (jc 0 95 - 200)/40, jc 0 95 tiene un valor de 265.8. Esto significa que el inventario 
a principio de cada mes no debe ser menor de 266 unidades para que la probabilidad 
de agotar las existencias no sea mayor de 0.05. 

Ejemplo 5.4 Supongase que el diametro externo de cierto tipo de cojinetes se en¬ 
cuentra, de manera aproximada, distribuido normalmente con media igual a 3.5 cm 
y desviacion estandar igual a 0.02 cm. Si el diametro de estos cojinetes no debe ser 
menor de 3.47 cm ni mayor de 3.53 cm, £cual es el porcentaje de cojinetes, durante 
el proceso de su manufactura, que debe desecharse? 

Sea X el diametro del cojinete, en donde X es /V (3.5, 0.02). La probabilidad de 
que el diametro se encuentre entre 3.47 cm y 3.53 es: 
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POM 3.53) = W 3 ' 4 q 02 3 ' 5 < Z < 

= P(-1.JSZS1.5) 

S = F z (1.5;0, 1) - F z (-1.5;0, 1) 

= 0.8664. 

Dado que el 86.64% de los cojinetes cumplen con las especificaciones determinadas, 
se deduce que 1 -0.8664 = 0.1336, o, en otras palabras, debe desecharse el 13.36% 
de la production. 

En el ejemplo 3.11 se determino que para la distribucibn normal estandar los valo- 
res del primero y tercer cuantil son, de manera aproximada, iguales a -0.675 y 0.675 
mientras que los correspondientes a los deciles primero y noveno son alrededor de 
-1.28 y 1.28 respectivamente. De (5.10) se sigue que ri X es N(p,a), los valores de los 
cuantiles primero y tercero de X son x 0 25 = -0.675c + p y x 075 = 0.675c + n- 
Deesta manera el recorrido intercuantil es jc 0 75 - x 025 = 1.35cr. De manera simi¬ 
lar,' los valores de los deciles primero y noveno son: x ol0 = -1.28o- + p y 
ro .90 = 1.28<r + fi, y el recorrido interdecil esta dado por x 090 - x 0 , 0 = 2.56c. 
Del ejemplo 3.11, se puede concluir que si X ~ la desviacibn media de .Yes 

E\X - n\ = 0.7979c. (5.15) 

La tabla 5.1 contiene las propiedades basicas de la distribucion normal. 

Ejemplo 5.5 La primera columna de la tabla 5.2 contiene los intervalos de respues- 
tas correctas para la prueba de matematicas (SAT); la segunda, el correspondiente 
numero de calificaciones observadas para el periodo 1979-1980, tal y como fueron 
dadas a conocer en el College Board ATP Summary Report; la tercera columna, las 
frecuencias relativas, las restantes, informacion con respecto a si las calificaciones 
para la prueba SAT obtenidas por los hombres estaban distribuidas normalmente 
con media 491* y desviacion estandar igual a 120*. 

* Hstos datos se proporcionan en el College Board ATP Summary Report, 1979-1980. 


3.53 - 3.5 \ 
0.02 / 


TABLA 5.1 Propiedades basicas de la distribucibn normal 


Funcion de densidad de probabilidad 


Pardmelros 


Jlx- ju, er) = 

1 

r l 


ft, 

a, a > 0 

< * 

exp 

\Z2tt a 

— 00 

l 2\ * )\’ 

< x < * 


Media Varianza 

Desviacion Recorrido 

media intercuantil 

Recorrido 

interdecil 

Coeficiente 
de asimelria 

Curtosis 

relativa 

M <r 2 

0.7979a- 

1.35a 

2.56a 

0 

3 
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TABLA 5.2 Calificaciones obtenidas en la prueba de matem&ticas SAT por los estudiantes 
del tercer aflo de preparatoria en el ciclo 1979-1980 


Numero de 
respuestas 
correctas 

Numero de 

examenes 

Frecuencia 

relativa 

Intervalo 

normal 

estandar 

Probabilidad 
del intervalo 

Numero 

esperado 

(200-249) 

3 423 

0.0072 

(-2.425- -2.01) 

0.0146 

6 981.62 

(250-299) 

18 434 

0.0385 

(-2.01- -1.59) 

0.0337 

16 115.10 

(300-349) 

39 913 

0.0835 

(-1.59- -1.18) 

0.0631 

30 173.98 

(350-399) 

51 603 

0.1079 

(-1.18- -0.76) 

0.1046 

50 018.99 

(400-449) 

61 691 

0.1290 

(-0.76- -0.34) 

0.1433 

68 525.06 

(450-499) 

72 186 

0.1510 

(-0.34-0.075) 

0.1630 

77 945.46 

(500-549) 

72 804 

0.1522 

(0.075-0.49) 

0.1580 

75 554.49 

(550-599) 

58 304 

0.1219 

(0.49-0.91) 

0.1307 

62 499.83 

(600-649) 

46 910 

0.0981 

(0.91-1.325) 

0.0888 

42 463.54 

(650-699) 

30 265 

0.0633 

(1.325-1.74) 

0.0517 

24 722.58 

(700-749) 

16 246 

0.0340 

(1.74-2.16) 

0.0255 

12 193.92 

(750-800) 

6 114 

0.0134 

(2.16-2.575) 

0.0104 

4 973.21 

Totales 

478 193 

1.0000 


0.9874 

472 167.78 


Mientras que, de manera aparente, existe una similitud entre las frecuencias teoricas 
y las observadas, queda aun por contestar la pregunta acerca de cu&ndo puede rechazar- 
se o no (vease Cap. 10) la hipotesis de que las calificaciones de la prueba SAT se distri- 
buyeron normalmente con media 491 desviacion estandar igual a 120. Como se men- 
cion6, siempre es importante verificar lo que ocurre en los extremos de la distribution 
observada. Por ejemplo, se sabe que para la prueba SAT es imposible obtener califica¬ 
ciones para los eventos X < 200 y X > 800. Sin embargo, si X ~ N(491), las corres- 
pondientes probabilidades son 120), P(X < 200) = 0.0075 y P(X > 800) = 0.005. 
El siguiente ejemplo debe ilustrar de manera mas clara la falta de concordancia en 
los extremos, entre las distribuciones observadas y teorica. 

Ejemplo 5.6 El numero de unidades de un cierto producto que un comerciante ven- 
de al dia varia de manera aleatoria con cambios muy pequeftos que se deben a la 
temporada o al dia de la semana. Con base en information anterior, se cree que la de- 
manda diaria de este producto es una variable aleatoria normal con media y des¬ 
viacion estandar iguales a 100 y 12 unidades, respectivamente. Para comprobar su 
grado de creencia, el vendedor anota la demanda diaria durante los ultimos 102 dias 
y la agrupa como se muestra en la tabla 5.3. Comparar las frecuencias relativas que 
se observaron con las frecuencias teoricas al suponer una distribution normal con 
media 100 y desviacion estandar 12. 

Como se ilustra en la figura 5.4, las frecuencias relativas que se observan en la 
demanda diaria sugieren una curva en forma de campana. Sin embargo, la tabla 5.4 
en que se comparan las frecuencias relativas teorica y observada, muestra una 
discrepancia muy grande en los extremos a pesar de que existe una buena concordan¬ 
cia alrededor de la media. Suponer una distribution normal para este tipo de si- 
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TABLA 5.3 Demanda diaria de un producto 


Demanda diaria Frecuencia 


(55-64) 

6 

(65-74) 

4 

(75-84) 

6 

(85-94) 

20 

(95-104) 

32 

(105-114) 

18 

(115-124) 

6 

(125-134) 

6 

(135-144) 

4 


tuacion puede llevar a errores muy grandes cuando es necesario tener information 
sobre los extremos. 

Recuerdese que la distribucion binomial es una forma limite de la distribution de 
Poisson cuando n es grande y p pequefto. Se desea demostrar que la distribucion 
normal es una forma limite de m binomial cuando n es grande y p no tiene un valor 
cercano a cero o a uno. El siguiente teorema, que se conoce como teorema del limite 
de DeMoivre-Laplace, asegura una aproximacion adecuada mediante la distribucion 
normal de las probabilidades binomiales si n es suficientemente grande. 


Teorema 5.1 Sea X una variable aleatoria binomial con media np y desviacion es- 
tandar \Jnp{\ - p). La distribucion de la variable aleatoria tiende a la normal 


X - np 
\/np( 1 - p) 


(5.16) 



F1GURA 5.4 Frecuencias relativas que se observan para la demanda diaria de un producto 
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estandar conforme el numero de ensayos independientes Se proporciona un 

desarrollo de la prueba en un apendice al final de este capltulo. 


La esencia del teorema 5.1 es que si X es una variable aleatoria binomial, para 
la que el numero de ensayos independientes es suficientemente grande, se dice que 
X posee una distribution normal aproximada con media np y desviacion estandar 
\Jnp( 1- p). De hecho, la aproximacion es adecuada tanto como np > 5 cuando 
p s 1/2, o cuando n( I - p) > 5 para/? > 1/2. Esto es, 


P(a <X B <ib) 




a - np 
W>ip( i - p) 




b - np 
yjnp(\ - p) 


(5.17) 


en donde Z N es N(0.1). 

La aproximacion dada por (5.17) puede mejorarse si se tuma en cuenta que lo 
que se desea es aproximar probabilidades para una variable aleatoria discreta a par- 
tir del intervalo de probabilidades de una variable aleatoria continua. Por ejemplo, 
se desea determinar la probabilidad de que X tome un valor igual a x. Se sabe que 
para cualquier valor especifico x de una variable aleatoria binomial, la probabilidad 
puntual es distinta de cero. Sin embargo, si se emple a la aproximacion normal dada 
por el teorema 5.1, P[Z = (x - np)/\Jnp( 1 - p)] = 0. En lugar de emplear la 
expresion anterior, se usara la aproximacion normal para P(X = x) que determina 
la probabilidad de un intervalo de longitud uno (igual al incremento de la variable 
aleatoria binomial), de manera que el punto medio del intervalo sea igual al valor x. 
Por lo tanto, 


P(X B = x)~P 


x - np - 1/2 

. vV( i - p) 


< 7.. < 
— — 


x — np + l/2\ 

Vnp( 1 - p) ) 


Como resultado, la expresion (5.17) puede modificarse de la siguiente forma: 


P(a<X B <b)~pl 


a - np - 0.5 b - np + 0.5 

— Z N — 


\ y/np( 1 - p) 


y/np(l - p) 


(5.18) 


TABLA 5.4 Frecuencias relativas observada y teorica para la demanda diaria de un producto 


Demanda diaria 

Frecuencia 

relativa 

Intervalo normal 
estandar 

Probabilidad 
de! intervalo 

(55-64) 

0.0588 

(-3.75- -2.92) 

0.0017 

(65 - 74) 

0.0392 

(-2.92- -2.08) 

0.0170 

(75-84) 

0.0588 

(-2.08- - 1.25) 

0.0868 

(85-94) 

0.1961 

( - 1.25- -0.42) 

0.2316 

(95-104) 

0.3137 

(-0.42-0.42) 

0.3256 

(105-114) 

0.1765 

(0.42-1.25) 

0.2316 

(115-124) 

0.0588 

(1.25-2.08) 

0.0868 

(125-134) 

0.0588 

(2.08-2.92) 

0.0170 

(135-144) 

0.0392 

(2.92-3.75) 

0.0017 

Totales 

0.9999 


0.9998 
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Ejemplo 5.7 Una organization politica planea llevar a cabo una encuesta para detec- 
tar la preferencia de los votantes con respecto a los candidatos Ay B que ocuparan un 
puesto en la administration publica. Supbngase que toma una muestra aleatoria de 
mil ciudadanos. ^Cufil es la probabilidad de que 550 o m&s de los votantes indiquen 
una preferencia por el candidato A si la poblacidn, con respecto a los candidatos, se 
encuentra igualmente dividida? 

Sea X la variable aleatoria que representa el numero de ciudadanos que tienen 
preferencia por el candidato A. La muestra aleatoria de mil votantes puede pensarse 
como un conjunto de ensayos independientes con una probabilidad de exito, en cada 
ensayo, igual a 0.5 (candidato A), dado que, por hipotesis, la poblacion de votantes 
se encuentra igualmente dividida entre los candidatos. De esta forma, X es una v a- 
riable aleatoria binomial con media np = 500 y desviacion estandar y/np(\ - p) = 
15.81. La probabilidad de que X > 550se puede aproximar, de manera adecuada, 
mediar.te -! empleo de la distribution normal dado que n es suficientemente grande: 
grande: 

P(X > 550) - P[Z N > (549.5 - 500)/15.81] 

= 7>(Z„>3.13) 

= 0.0009. 

Como la probabilidad de tal hecho es muy pequena, si p es igual a 0.5 puede con- 
cluirse que A sera el ganador en la encuesta, ya que 550 o mas personas indicaran una 
preferencia por el. 


5.3 La distribucion uniforme 

Supongase que ocurre un evento en que una variable aleatoria toma valores de un in- 
tervalo finito, de manera que estos se encuentran distribuidos igualmente sobre el 
intervalo. Esto es, la probabilidad de que la variable aleatoria tome un valor en cada 
subintervalo de igual longitud es la misma. Se dice entonces que la variable aleatoria 
se encuentra distribuida uniformemente sobre el intervalo. 


Definition 5.2 Se dice que una variable aleatoria X esta distribuida uniformemente 
sobre el intervalo (a, b) si su funcion de densidad de probabilidad esta dada por: 


fix', a , b) 


\\/{b - a) 

1 ° 


a < a < b, 

para cualquier otro valor 


(5.19) 


La funcion de densidad de probabilidad de una distribucion uniforme es cons- 
tante en el intervalo (a, b), como se ilustra en la figura 5.5. Por esto, tal distribucion 
tambien se conoce como distribucion “rectangular”. 
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> 


fix) 


1 lib-a) 


a b x 


FIGURA 5.5 Grafica de la funcion de densidad de probabilidad uniforme 

La funcion de distribucion acumulativa se determina de manera facil y esta dada 
por 

P{X < x) = Fix ; a, b) = (b - a)~ ] I dt 

J a 

[ 0 x < a, 

(x — a)jib -a) a < x < b, (5.20) 

1 x > b. 

Se sigue entonces que, para cualquier subintervalo (a,, bf) interior a (a, b): 

Pia i s * s &,) = F(6,; a, b) - F(a,; a, fe) 

= (b, - a t )/ib - a). (5.21) 

Este resultado ilustra que la probabilidad de que A" tome valores del subintervalo 
(a |, b,) es l/(b - a) por la longitud del subintervalo y, de esta forma, igual a la proba¬ 
bilidad de que X tome un valor en cualquier otro subintervalo de la misma longitud. 

La distribucion uniforme proporciona una representacion adecuada para redon- 
dear las diferencias que surgen al medir cantidades flsicas entre los valores observados 
y los reales. Por ejemplo, si el peso de un individuo se redondea al kilogramo 
mas cercano, entonces la diferencia entre este y el peso verdadero sera algun valor 
entre-0.5 y 0.5 kg. Es comun que el error de redondeo se encuentra distribuido uni- 
formemente en el intervalo (-0.5, 0.5). Otro uso de la distribucion uniforme es pro- 
porcionar una aproximacion clara sobre un intervalo muy pequeno cuya distribu¬ 
cion es distinta a la uniforme. 

Ejemplo 5.8 Con respecto al ejemplo 1.1, si se supone que las cuotas se encuentran 
distribuidas de manera uniforme en el intervalo ($81.5-$111 .5), entonces la funcion 
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de densidad de probabilidad se determina por: 

/(jc; 81.5, 111.5) = 1/30, 81.5 s * < 111.5. 

Se sigue de (5.21) que la probabilidad de que una cuota se encuentre en un subin- 
tervalo de longitud $5 (la amplitud de clase en el ejemplo 1.1) es 5/30. En la tabla 5.5 
se proporciona una comparacion entre las frecuencias relativas dadas en la tabla 1.1 
y las correspondientes probabilidades teoricas, con base en la distribucion uniforme. 
Como puede observarse, la concordancia entre las frecuencias teoricas y observadas 
es aparente. 

El valor esperado de una variable aleatoria distribuida de manera uniforme es 

E(X) = (b - a)~' f xdx 

Jo 

= (a + b)/2. (5.22) 

Para obtener los momentos superiore: de X, es mas facil trabajar con la variable 
aleatoria Y = X - ((a + b)\/2, que desplaza la media a cero, dado que E(Y) = 
E(X) - [(a + b)]/2. De esta forma: 

f{y\0)= 1/0, -0/2<y<0/2, (5.23) 

en donde 9 = b - a. De acuerdo con lo anterior, el r-esimo momento central de Y 
es igual al r-esimo momento central alrededor del cero, esto es: 

M,<n = nr(y) = 


y r dy 

J - 9/2 


r + 1 


9/2 

-9/2 


0 si r es impar 

^/[(r+I)2 r ] si res par. 


(5.24) 


TABLA 5.5 Comparacion entre las frecuencias teorica y observada para una distribucion 
uniforme 


Cuota 

anual 

Numero 

observado 

Frecuencia 

relativa 

Intervalo 

uniforme 

Probabilidad 
del intervalo 

Numero 

esperado 

82- 86 

3 

0.075 

81.5- 86.5 

0.167 

6.667 

87- 91 

7 

0.175 

86.5- 91.5 

0.167 

6.667 

92- 96 

8 

0.200 

91.5- 96.5 

0.167 

6.667 

97-101 

8 

0.200 

96.5-101.5 

0.167 

6.667 

102-106 

7 

0.175 

101.5-106.5 

0.167 

6.66 7 

107-111 

7 

0.175 

106.5-111.5 

0.167 

6.667 

Totales 

40 

1.000 


1.000 
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Dado que ni la varianza ni los factores de forma se ven afectados por el cambio de 
localizacion, la varianza, el coeficiente de asimetria y la curtosis relativa de la va¬ 
riable aleatoria distribuida uniformemente se encuentran a partir de (5.24) y estan 
determinadas por: 


Var(X) 

«jWO 

aJiX) 


(b - a) 2 / 12, 

0, y 

(b - a )*/80 
l(b - af/\2\ 2 


9 

5' 


(5.25) 

(5.26) 

(5.27) 


Puede emplearse (5.23) para determinar la desviacion media de la siguiente manera: 

f»/2 

E\y\ = O'*} g/ 2 \y\dy 



= 6/4. (5.28) 


De esta forma la desviacion media de una variable aleatoria distribuida de manera 
uniforme esta dada por (b - a)/4. 

Una distribucion uniforme es simetrica y tiene un pico menor que el de la distri¬ 
bution normal, no tiene moda y su mediana es igual a la media. Los valores cuanti- 
les x q , correspondientes a la proporcion acumulativa q, son de manera tal que: 


los que, por (5.20) son: 


F(x q ; a , b) = q, 


x q = a + (b - a)q. 


(5.29) 


En la tabla 5.6 se encuentran resumidas las propiedades de esta distribucion. 

Mas adelante se examinara el caso especial cuando a = 0 y b = 1. Este ultimo se 
conoce como distribucion uniforme sobre el intervalo unitario (0, 1) con funcion de 


TABLA 5.6 Propiedades basicas de la distribucion uniforme 


Funcion de densidad de probabilidad 

Parametros 


fix: «, h) 

= 1 /ib - a). 

-c 

VI 

Vi 

a. — x < « < * 

b. - x < b < *. 


Media 

Varianza 

Desviacion 

media 

Coeficiente 

Valor de! de 

cuantil asimetria 

Curtosis 

relativa 

ia + h)/2 

ib - «)7l2 

ib - a)/4 

x q = a + ib - a)q 0 

9/5 
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densidad de probabilidad: 

/Oc; 0, 1) = l, 0<.r<l. (5.30) 

Esta distribution es, de manera especial, muy importante ya que tiene un papel clave 
en la simulation por computadora de los valores de una variable aleatoria con una 
distribucibn especifica. 


5.4 La distribucion beta 

Una distribucion que permite generar una gran variedad de perfiles es la distribucion 
beta. Se ha utilizado para representar variables fisicas cuyos valores se encuentran 
restringidos a un intervalo de longitud finita y para encontrar ciertas cantidades 
que se conocen como limites de tolerancia sin necesidad de la hipotesis de una distri- 
bucibn normal. Adem&s, la distribucibn beta juega un gran papel en la estadistica 
bayesiana. Se examinar^ un ejemplo de lo anterior en el capitulo seis. 


Definition 5.3 Se dice que una variable aleatoria X posee una distribucion beta si 
su funcion de densidad de probabilidad esta dada por: 


fix', a, (3) 


Ha + (3) 
Ha)H3) 

0 


,t“~'(l 


x ) 0 ~ 1 


0 < x < 1, a, B > 0, 

(5.31) 

para cualquier otro valor 


Las cantidades «y^ de la distribucion beta son, ambas, parametros de perfil. 
Valores distintos de a y f3 daran distintos perfiles para la funcion de densidad beta. 
Sin tanto a como /3 son menores que uno, la distribucion beta tiene un perfil en for- 
madeU. Si a < 1 y j8 ^ 1, la distribucibn tiene un perfil de J transpuesta, y si 
/3 < I ya > 1, el perfil es una J. Cuando tanto a y f3 son ambos mayores que uno, 
la distribucibn presenta un pico en x = (a - l)/(a + (3 -2). Finalmente, la 
distribucibn beta es simetrica cuando a = (3. En la figura 5.6 se encuentran ilustra- 
dos estos perfiles para valores especificos de a y /LNbtese que si en (5.31) xse reem- 
plaza por x — 1, se obtiene la siguiente relacion de simetria 

/(I - jc; /3, a) = f(x- a, jS) (5.32) 


El nombre de esta distribucibn proviene de su asociacion con la funcion beta que 
se encuentra definida por 


B(a, 



x a ~‘(\ - xf-'dx. 


(5.33) 


Puede demostrarse que las funciones beta y gama se encuentran relacionadas por la 
expresion 


B(a, f3) 


r(a)f(/3) 

f(a + f3 )’ 


(5.34) 
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F1GURA 5.6 Graficas de la funcion de densidad beta para distintos valores de a y P 


Mediante el empleo de (5.33) y (5.34), es obvio que (5.31) es una funcion de densidad 
de probabilidad. Esto es: 


Ha + /3) 

r(a)r(j8) 


■i 

Jo 


*“-'(1 - xf-'dx 


Ha + P) 

r(«)r(/3) 


B(a,i 3 ) = 1 , 


y puesto que f{x\ a, P) es no negativa, (5.31) es una funcion de densidad de proba¬ 
bilidad. 

La funcion de distribucion acumulativa se encuentra definida por: 


ro 


x < 0, 


P(X < x) = F(x; a, p) = 


r(q + P) r 

r(a)r(p) Jo 

J 


r“‘ l (l - tf-'dt 


0<x<l, (5.35) 

jc > 1. 


La integral que aparece en (5.35) es la funcion beta incompleta: 

B x (a,p) = [ - tf-'dt. (5.36) 

Jo 

De esta forma, la funcion de distribucion beta puede expresarse como un cocien- 
te de funciones beta incompletas, 

F(x; a , P) = B x (a, P)/B(a, P) 

= •/,(«*, 0) 0 < x < 1, (5.37) 

donde l x (a, p) se encuentra tabulada de manera extensa (vease [5,6]). En [5], los 
valores cuantiles x son aquellos para los que I x (a, P) es igual a 0.0025,0.005, 0.01, 
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0.025,0.05,0.1, 0.25 y 0.5 para las distintas combinaciones de a y p. Con el fin de 
encontrar los valores cuantiles correspondientes a puntos de alto porcentaje, consi- 
derese lo siguiente: 

P(X < x) = F(1 - X > 1 - x) 

= 1 - P(i - 1 - x)\ 

entonces, por la relacion de simetrla (5.32): 

F{x\ a, P) = 1 - F(1 - x; /3, a) 
o 


I x (ot,P) = 1 - /|_*03,a). (5.38) 

De esta manera, los valores cuantiles para los puntos de alto porcentaje se en- 
cuentran al intercambiar a y (3 y toman el punto de porcentaje igual a 1 - x. A ma¬ 
nera de ilustracion, sea X una variable aleatoria beta con a - 2y (3 = 4; los valores 
cuantiles 90, 95 y 99 son 0.58389, 0.65741 y 0.77793, respectivamente. En la tabla 5.7 
se proporcionan los valores cuantiles para combinaciones de valores de a y P que dan 
origen a los distintos perfiles de la distribucidn beta. 

Es m&s facil obtener los momentos de la variable aleatoria beta mediante el empleo 
del metodo directo, que por el uso de la funcion generadora de momentos, debido a 
que esta ultima no tiene una forma sencilla. En particular, se encontrara una expre- 
sion general que permita obtener el /--esimo momento alrededor del cero y despues 
emplearla para obtener los momentos restantes: 

^ = E(Xr) = 7 ~ xf-'dx 
* r(a)F(P) Jo 


r(« + p) 
naW(p) 


B(a + r, P) 


Como resultado, 


Ha + b) Rq + rW(p) 
ndflXP) T(q + p + r ) 

Rq + ^)Rq + r) 
f(q)r(q + p + r) 


Rq 4- fflRq + 1) 

r(q)r(a + p + 1) 


y 


a 

a + p’ 


Vcir(X) = 


q(q + I) 

(q + p)(a + p + 1) 


ap 

(a + P) 2 (a + p + I) 


■» 

Of 

(q + P) 2 


(5.39) 


(5.40) 


(5.41) 


www. FreeLibros. com 



150 Algunas distribuciones continuas de probabilidad 


TABLA 5.7 Valores de cuantiles beta para distintas combinaciones de a y p 



Xo.25 


x 01i 

« = P = 1/2 

0.14645 

0.50000 

0.85355 

a = 1/2, p = 2 

0.02831 

0.12061 

0.31122 

a = 2, p = 1/2 

0.68878 

0.87939 

0.97169 

a = 4, p = 6 

0.29099 

0.39308 

0.50199 


A1 seguir este procedimiento y despues de efectuar el algebra necesaria, el coeficiente 
de asimetria y la curtosis relativa para la distribution beta estan dadas por: 


y 


a 3 (X) = ~^—= 


2(f3 - a) y/a + P .+ 1 


V«/3 (a + [3 + 2) 


(5.42) 


a A (X) = 


3(a + p + l)[2(a + p) 2 + afta + j3 - 6)] 
aP(a + P + 2)(a + P + 3) 


(5.43) 


Mediante el examen de (5.42) puede observarse que la distribucion beta es simetrica 
solo si a = p, tal y como ya se habia mencionado. Si a < p, la distribucion dene 
un sesgo positivo y si a > p, la distribucion presenta un sesgo negativo. 

En la tabla 5.8 se proporciona un resumen de las propiedades de la distribucion 
beta. 

Algunas areas, en las que se emplea la distribucion beta como modelo de proba 
bilidad incluyen la distribucion de ardculos defectuosos sobre un intervalo de tiempo 
especifico; la distribucion del intervalo de tiempo necesario para completar una fase 
de proyecto en PERT, evaluacibn de programas y tecnicas de revision, (en este caso 
se emplea la distribucion beta generalizada; vease [14]); la distribucion de la propor- 
cion de los valores que deben caer entre dos observaciones extremas. 


TABLA 5.8 Propiedades basicas de la distribucion beta 


Funcion de densidad de probabilidad 

Parametros 


fix; a. p) = 

- Via + P) x" 'l\ xf 1 
l(a)l’O) 

a. tv > 0 

p. p> 0 



0 < v < 1 



Media 

Varianza 

Coeficiente 
de asimetria 

Curtosis 

relativa 

a 

ap 

Up — a) sja + P + I 


a + p 

(a + P)\a + p + 1) 

\/ap (a + P + 2) 


*3(« + fi + 1)| 2( 

a + (3) : + + fi - 6)| 



afiiu + 

b + 2)(« + fi + 3) 
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La esencia de esta ultima area tiene relacion con los limites estadisticos de tole- 
rancia. Estos limites son muy importantes, especialmente en el control estadistico de 
calidad donde el control de variabilidad de un producto es esencial. Este control, en 
general, se lleva a cabo mediante la medicion de algunas propiedades del producto o 
determinando los ajustes que deben hacerse al proceso de produccion para mejorar 
la calidad del producto. Los limites estadisticos de tolerancia no son iguales a las to- 
lerancias fisicas o especificaciones limite. Estos son conjuntos de criterios diseAados 
para un proceso de produccion en particular y que se espera que todas las unidades 
cumplan. Los limites estadisticos de tolerancia se trataran en el capitulo ocho. 

Puede demostrarse que si la suma de los parametros que determinan el perfil de la 
distribucion beta es, de manera relativa, grande, la funcion de distribucion acumulati- 
va beta (5.35) se puede aproximar de manera adecuada por la diferencia de dos fun- 
ciones de distribucion normal estandar. Esto es: 


en donde: 


F(x; a, (3) * F„(z u ; 0, 1) - F„(z e ; 0, 1), 


[yS] -0.5 -*(« + £- 1)(1 - x) 
[(a + P - 1)W(1 - x)} ]/2 
(a + p - 1)(1 - x) + 0.5 
Ka + P- DW(1 - x)]' /2 ’ 


(5.44) 


y 1)3] denota el entero mas grande que no excede a /3. En la tabla 5.9 se tiene una 
comparacion entre los valores de la funcion beta dados por (5.35) con aquellos pro- 
porcionados por (5.44). Para cada valor x, el primer renglon correspondiente a esta 
es el valor exacto de la distribucion beta y el siguiente es el que proporciona (5.44). 
Para valores distintos de los finales, la aproximacion es adecuada. Sin embargo, no- 
tese que la discrepancy en los valores superiores disminuye conforme la suma de a y 
)3 es mas grande. 


TABLA 5.9 Comparacion entre las funciones de distribucion beta y normal 


X 

a = )3 = 5 

a = 10, /3 = 5 

a = 10, 13 = 15 

0.10 

0.0008909 

0.0000001 

0.0000521 


0.0000317 

0.0 

0.0000007 

0.25 

0.04893 

0.0003419 

0.05466 


0.04182 

0.0001078 

0.04947 

0.50 

0.50 

0.08978 

0.8463 


0.4996 

0.09009 

0.8461 

0.75 

0.95107 

0.74153 

0.99989 


0.94118 

0.72564 

0.99886 

0.90 

' 0.9991091 

0.99077 

1.0 


0.9405883 

0.95160 

0.9756 
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5.5 La distribution gama 

Otra distribution de gran uso es la distribution gama . Entre los muchos usos que 
esta distribution tiene se encuentra el siguiente: supongase que una pieza metalica se 
encuentra sometida a tierta fuerza, de manera que se rompera despues de aplicar un 
numero espetifico de ciclos de fuerza. Si los ciclos ocurren de manera independiente 
y a una frecuencia promedio, entonces el tiempo que debe transcurrir antes de que el 
material se rompa es una variable aleatoria que cumple con la distribution gama. 


Definition 5.4 Se dice que la variable aleatoria X tiene una distribution gama si su 
funcibn de densidad de probabilidad esta dada por: 


f{x\ a, 9) 


f r(a)0° 


x a 1 exp(-x/0) 


10 


x > 0, a, 0 > 0 

(5.45) 

para cualquier otro valor, 


en dond° T(a) es la funcion gama definida en el capltulo tres. 

La distribution gama es muy versatil puesto que exhibe varios perfiles que de- 
penden del valor del parametro a. En la figura 5.7 se ilustran distintos perfiles de la 
funcidn de densidad gama para distintos valores de a y 9. Como puede observarse, 
para a^l, la distribucion gama tiene un perfil en forma de J transpuesta. Para 



FIGURA 5.7 Graficas de la funcion de densidad gama para distintos valores de a y 6 
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a > 1, presenta un pico que ocurre en x = 0(a - 1). Para un valor fijo de 6 , el 
perfil basico de la distribution gama no se altera si el valor de a cambia. Lo anterior 
da como resultado que las cantidades ay 0 son los factores de forma y de escala, 
respectivamente, de la distribution gama. j 

Esta distribucidn se emplea de manera extensa en una gran diversidad de Sreas; 
por ejemplo, para representar el tiempo aleatorio de falla de un sistema que falla s61o 
si de manera exacta los componentes fallan y la falla de cada componente ocurre 
a una frecuencia constante \ = I/O por unidad de tiempo. Tambien se emplea en 
problemas de lineas de espera para representar el intervalo total para completar una 
reparation si esta se lleva a cabo en subestaciones; completar la reparacidn en cada 
subestacion es un evento independiente que ocurre a una frecuencia constante igual 
a \ = I/O. Existen algunos ejemplos que no siguen el patron anterior, pero que se 
aproximan de manera adecuada mediante el empleo de la distribucidn gama, como 
los ingresos familiares y la edad del hombre al contraer matrimonio por primera vez. 

Mediante el empleo de la funcion gama dada por (3.5), puede demostrarse que 
(5.45) es una funcion de densidad de probabilidad. Para hacerlo, considerese un 
cambio de variable de integracidn, tal que u = x/0, x = 0u y y dx = Odu\ en- 
tonces: 

FSi? 1 ''"expt-oc/ewr - — [ <»«r W-«)w« 

= FS)I "■" exp( -“ w " - '• 

dado que T(a) = /o u a ~'exp(-u)du. 

Con un procedimiento similar se demuestra que el r-esimo momento alrededor 
del cero es: 


* i hr l 

- + r) 

Ha) 


Se sigue, por lo tanto, que: 

y 


E(X) = aO 


Var(X) = a0 : 


(5.46) 


(5.47) 

(5.48) 


Ademas, despues de obtener los momentos centrales apropiados, se puede demostrar 
que el coeficiente de asimetria es 


a,(A") = 2/V«. 


(5.49) 
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y la curtosis relativa esta dada por: 

a 4 (X) = 3^1 + (5.50) 

Notese que a partir delos factores de forma a 3 (A r ) y a A (X), la distribucion gama 
tiene un sesgo positivo y mas picos que la distribucion normal, puesto que a 4 (A") > 3 
para cualquier a > 0. Sin embargo, tambien debe notarse que conforme el para- 
metro a se hace cada vez mas grande, el sesgo se convierte en menos pronunciado y 
la curtosis relativa tiene el tres como valor limite. De hecho, para valores grandes de 
a la distribucion gama puede aproximarse, en algun grado, por una distribucion 
normal. Esto es, la variable aleatoria 

Z = (X - <x6)/6\Ja (5.51) 


es, de manera aproximada, igual a la normal estandar para valores grandes de a. 

La funcion generadora de moment os para la variable aleatoria gama X esta dada 
por: 


E[exp(/A')] 


1 


x a 'exp[-(l - 0t)x/0\dx. 


r(a)6>“ Jo 

Sea „ = (i - dt)x/e , x = ud/(\ - dt ), y dx = [ 0/(1 - 0t)\du. Entonces: 


E'lexp(/A')] = 


a 

U 

r Jo 77 


e a , o 

7 exp( -u) —-— du 


n«)r Jo (i - eif -'"'(i - so 

l 


f(a)(l - 9iy 


-X 

u a ~ 

Jo 


'exp( - u)du 


= (1 - ( 9 /)”“, 0 < / < \/d. 


(5.52) 


La funcion de distribucion acumulativa se determina por la siguiente expresion: 


F(x; a, 6) 


-L- r 

r(a)0" Jo 


t a 'exp {-t/6)dt. 


x > 0. 


(5.53) 


Se tabularon muchas versiones de (5.53). Por ejemplo, si se efectua el cambio de va¬ 
riable u = t/6 de manera tal que / = du y dt = ddu, entonces (5.53) toma la si¬ 
guiente forma: 


1 f A/ " 

F(.r, a. 0) = —— {0u) a _l exp( -n)0du 

1 (aW 

1 f t/H 

= 7 —- u" 'exp (-n)dn. 

1 (a) Jo 

La integral J',/" it" " 'exp( - u)du se conoce como la funcion gama incompleta y 
se denota, generalmente, por y(x/0: a). El cociente de y(x/6\ a) y de la funcion 
gama completa I’(a) recibe el nombre de cociente de la funcion gama incompleta y 
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se encuentra tabulado en [8] para distintos valores de x/0 y a. De acuerdo con lo 
anterior, la funcion gama de distribucion acumulativa se escribe como: 

P(X < x) = F(x; a, 9) = y{x/9\ a)/r(a). (5.54) 

En [7] se encuentra una tabla muy extensa de los valores de una funcion equivalente 
a (5.53), dada por: \ 

I(u, p ) = F(x; a, 0), (5.55) 

donde u = x/9\fa y p = a - 1. Debe notarse que si el parametro de forma a es 
un entero positivo, (5.55) se puede expresar, en forma cerrada: 

FU, «, «) = 1 - [l + J + j;(i) + - + (5.56) 

como resultado de efectuar varias integraciones por partes. Tambien el valor cuantil 
x q para el que F(x,/, a, 0) = q no puede determinate de manera directa; este 
puede interpolarse a partir de los valores que aparecen en las tablas dadas en [7] p 
[8]. En la tabla 5.10 se da un breve resumen de las propiedades basicas de la distribu¬ 
cion gama. 

Ejemplo 5.9 Supongase que cierta pieza metalica se rompera despues de sufrir dos 
ciclos de esfuerzo. Si estos ciclos ocurren de manera independiente a una frecuencia 
promedio de dos por cada 100 horas, obtener la probabilidad de que el intervalo de 
tiempo se encuentre hasta que ocurre el segundo ciclo: a) dentro de una desviacion 
estandar del tiempo promedio, y b) a mas de dos desviaciones estandar por encima 
de la media. 

Sea X la variable aleatoria que representa el lapso que transcurre hasta que la 
pieza sufre el segundo ciclo de esfuerzo. Si X tiene una distribucion gama con a = 2 
y 9 - 50 horas debido a que la frecuencia promedio es 0.02 por hora. La fun- 


TABLA 5.10 Propiedades de la distribucion gama 


Funcion de densidad de probabilidad 


Parametros 

I(x\ a, 9) - x a 'exp( -x/9) 

l (a)9 


a, a > 0 

x > 0 


9 , 9 > 0 

Media Varianza 

Coeficiente 
de asimelrt'a 

Curtosis relativa 

ad k a0 2 

2/Va 

3 (' + ;) 
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cion de densidad de probabilidad es 

fix', 2, 50) = -x exp( -jc/50), * > 0, 

y la funcion de distribucion acumulativa dada por (5.56) se reduce a: 

Fix; at, 0) = 1 - + ^exp(-x/50), x > 0. 

De (5.47) y (5.48), los valores de la media y de la desviacion estandar de X son 100 y 
70.71, respectivamente. De acuerdo con lo anterior: 

Pip - a < X < p + o-) = P( 29.29 < X < 170.71) 

= Fi 170.71; 2, 50) - F(29.29; 2, 50) 

= 0.7376. 

Nutese que la probabilidad de que el lapso sea menor de una desviacion estandar 
por debajo de la media es de 0.1172 y la probabilidad de que este sea mas grande que 
la media por una desviacion estandar es 1 - 0.8548 = 0.1452. Finalmente: 

PiX > p + 2cr) - PiX > 241.42) 

= 1 - F(241.42;2, 50) 

= 0.0466. 

Ejemplo 5.10 Para demostrar el grado de concordancia entre las distribuciones 
normal y gama, se seleccionaron, para esta ultima, los valores de 3.5 y 7 para el para- 
metro de forma a, y para 0=10, calculandose las funciones de distribucion acu¬ 
mulativa para distintos valores de las correspondientes variables aleatorias. La in- 
formacion anterior se encuentra en la tabla 5.11. 

A partir de la information dada en la tabla 5.11, es evidente que la funcion de 
distribucion acumulativa normal sobreestima los valores dados por la correspon- 
diente funcion de distribucion acumulativa gama en los extremos, mientras que la 
subestima alrededor de la media. Lo anterior es valido para los dos valores de a; sin 
embargo, para a = 7, la concordancia en los extremos es considerablemente mejor 
que cuando a = 3.5. Como resultado, se espera que la concordancia aumente para 
valores de a mas grandes que siete. 

Cuando a es un entero positivo, la distribucion gama tambien se conoce como 
distribucion de Erlang en honor del cientifico danes que la uso por primera vez a 
principios del afio 1900 a fin de establecer resultados utiles para problemas de trafico 
en lineas telefonicas. Existe una asociacion entre los modelos de probabilidad de 
Poisson y de Erlang. Si el numero de eventos aleatorios independientes que ocurren 
en un lapso especifico es una variable de Poisson con una frecuencia constante de 
ocurrencia igual a I/0, entonces para una «, el tiempo de espera hasta que ocurre el 
a-esimo evento de Poisson tiene una distribucion de Erlang. Este resultado se sigue 
al hacer una comparacion entre las funciones de distribucion acumulativa de los mo- 
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TABLA 5.11 Comparacion entre las funciones de distribution acumulativa gama y normal 


a 

= 3.5, 9 

= 10, p = 

o- = 18.71 

2.5; jti = 35, 

a 

H 

J-J 

= 10, p = 6; 

cr = 26.46 

o 

f"- 

II 



Gama 

Normal 



Gama 

Normal 

X 

u 

/(«, P) 

F(x\ n, o-) 

X 

u 

nu, p) 

F{x; p, cr) 

0 

0 

0 

0.0307 

0 

0 

0 

0.0041 

5 

0.27 

0.0058 

0.0516 

10 

0.38 

0.000098 

0.0116 

10 

0.53 

0.0397 

0.0902 

20 

0.76 

0.004865 

0.0294 

15 

0.80 

0.1144 

0.1423 

30 

1.13 

0.0431 

0.0655 

20 

1.07 

0.2209 

0.2119 

40 

1.51 

0.1103 

0.1292 

25 

1.34 

0.3417 

0.2981 

50 

1.89 

0.2380 

0.2236 

30 

1.60 

0.4587 

0.3936 

60 

2.27 

0.3946 

0.3520 

35 

1.87 

0.5706 

0.5000 

70 

2.65 

0.5518 

0.5000 

40 

2.14 

0.6678 

0.6064 

80 

3.02 

0.6853 

0.6480 

45 

2.41 

0.7485 

0.7019 

90 

3.40 

0.7928 

0.7764 

50 

2.67 

0.8107 

0.7881 

100 

3.78 

0.8698 

0.8708 

55 

2.94 

0.8612 

0.8577 

110 

4.16 

0.9215 

0.9345 

60 

3.21 

0.8997 

0.9098 

120 

4.54 

0.9544 

0.9706 

65 

3.47 

0.9274 

0.9485 

130 

4.91 

0.9739 

0.9884 

70 

3.74 

0.9486 

0.9693 

140 

5.29 

0.9857 

0.9959 

75 

4.01 

0.9640 

0.9838 

150 

5.67 

0.9924 

0.9987 

80 

4.28 

0.9750 

0.9920 

160 

6.05 

0.9960 

0.9997 


delos de Poisson y de Erlang dadas por (4.17) y (5.56), respectivamente. Esto es, la 
probabilidad de que ocurran a lo mas a - 1 eventos de Poisson en un tiempo x a una 
frecuencia constante 1/0 se desprende de (4.17) y esta dado por: 


F P (a - l;x/8) = 



+ ••• + 


I 


(a - l)!\0 


exp( - x/9). 


Por otro lado, si se supone que el tiempo de espera sigue el modelo de Erlang, la 
probabilidad de que el tiempo de espera hasta que ocurra el a-esimo evento exceda 
un lapso x especifico, esta determinado por: 


P(X > x) = 1 - F.(x: a, 8) 


= 1 


.V ! / .Y 1 

1 + — + I — I 
8 2'\d 


1 


(a - 1 )!\0 


n 


X 1 / .Y 

— j — J -f -f 
8 2'.\0 (a - 1) 


= F,.(a - \:x/8). 


e.\p( ~.x/8) 

1 


/ ^ \ u 

!\ 0 / 


exp( -x/0) 


(5.57) 
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En otras palabras, la probabilidad de que el tiempo que transcurre hasta el 
a -esimo evento exceda el valor x es igual a la probabilidad de que el numero de even- 
tos de Poisson observados en x no sea mayor que a - 1. De esta forma, la distribu¬ 
tion de Erlang es el modelo para el tiempo de espera hasta que ocurre el a-esimo 
evento de Poisson, y la distribution de Poisson es el modelo para el numero de even- 
tos independientes que ocurren en un tiempo x, encontrandose este distribuido de 
acuerdo con el modelo de Erlang. En este contexto, 1/0 es la frecuencia constante 
de ocurrentia yd es el tiempo promedio entre dos ocurrencias sucesivas. 

Cuando el parametro de forma a es igual a uno, la distribucion de Erlang (gama) 
se reduce a lo que se conoce como la distribucion exponencial negativa. Esta distri¬ 
bucion se emplea de manera extensa para representar lapsos aleatorios de tiempo y 
se trata con gran detalle en una section subsecuente de este capitulo. Sin embargo, 
notese que la variable aleatoria de una distribucion exponencial negativa puede pen- 
sarse como el lapso que transcurre hasta el primer evento de Poisson. De acuerdo 
con lo anterior, la variable aleatoria de Erlang es la suma de variables aleatorias in¬ 
dependientes distribuidas exponencialmente. 

Otro caso especial del modelo de probabilidad gama es la distribution chi- 
cuadrado. Si se reemplaza en (5.45) el parametro de forma a con v/2 y el para¬ 
metro de escala 0 con 2, el resultado es la funcion de densidad de probabilidad de 
una variable aleatoria chi-cuadrado y se determina por: 


fix ; v) = 


nv/DT ' 1 

0 


x vl2 'exp( —.v/2) .v > 0 


(5.58) 

para cualquier otro valor. 


La distribucion chi-cuadrado se encuentra caracterizada por un solo parametro v, 
que recibe el nombre de grados de libertad. Como se vera, esta distribucion inter- 
viene en la inferencia estadistica y de manera especial al hacer inferencias con respec- 
to a las varianzas. Se emplea, de manera general, la notation X ~ xl para indicar 
que una variable aleatoria tiene una distribucion chi-cuadrado con v grados de li¬ 
bertad. 

La funcion de distribucion acumulativa esta dada por: 

P(X - .v) = nv j 2)T n. l t’ /2 ~' ex P< ~ t/2)dt x > 0, (5.59) 

y se encuentra tabulada de manera extensa. En la tabla E del apendice se encuentran 
los valores cuantiles .v,_ H ,,, de manera que 

/>(* £*,_„.,.) = f ' " f(x: v)dx = \ - a 


para algunas proporciones acumulativas seleccionadas 1 - a* y distintos valores 
de r- A manera de ilustracion, si v = 10, 


* En este contexto, la introduccion de la cantidad a, 0 £ a s I. sirve para facilitar una discusion poste¬ 
rior de un concepto que recibe el nombre de “probabilidad del error de tipo I”, que de manera general 
se denota por a. 
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P(X < Xoomo) = P(X ^ 2.55) = 0.01, 

P(X < Jr 0 .o5, lo ) = P(X < 3.94) = 0.05, 

P(X ^ x„. Mil0 ) = P(X < 18.31) = 0.95, 

x P(X < x 0 .*>..o) = P(X < 23.19) = 0.99. 

Los momentos de la distribuci6n chi-cuadrado se obtienen a partir de (5.47) a 
(5.50) y estan dados por: 

FAX) - v, 

Var(X) = 2v, 
a AX) = AI\Jlv, 


Analogamente y a partir de (5.52), la funcion generadora de momentos para la 
distribucion chi-cuadrado es: 

m x (t) = (1 - 2t)~ vn 0 < t < { ~. (5.60) 

Notese que una caracteristica interesante de la distribucion chi-cuadrado es que el 
valor de su varianza es dos veces el valor de su media. Adem&s, como est& distribu¬ 
cion es un caso especial de la distribucion gama, presenta un sesgo positivo y un pico 
mayor que el de una distribucion normal, pero el coeficiente de asimetria tiende a 
cero y a una curtosis relativa igual a tres conforme v tiende al infinito. 


«*(X) = 3 


5.6 La distribucion de Weibull 

La distribucidn de Weibull fue establecida por el fisico suizo del mismo nombre, 
quien demostro, con base en una evidencia empirica, que el esfuerzo al que se someten 
los materiales puede modelarse de manera adecuada mediante el empleo de esta dis¬ 
tribucion [9]. En los ultimos 25 aflos esta distribucion se empleo como modelo para 
situaciones del tipo tiempo-falla y con el objetivo de lograr una amplia variedad de 
componentes meccinicos y electricos. 


Definicion 5.5 Se dice que una variable aleatoria X tiene una distribucidn de 
Weibull si su funcion de densidad de probabilidad esta dada por: 


f{x\ a , 0) 



'exp[ —(.v/0)“] 


x > 0; a, 6 > 0, 


(5.61) 


para cualquier otro valor. 


La distribucion de Weibull es una familia de distribuciones que dependen de dos 
parametros: el de forma a y el de escala 6. Se puede introducir un parametro adi- 
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cional al reemplazar la variable aleatoria de Weibull X por X - a, en donde a e sun 
parametro de localization que representa un valor umbral o tiempo de garantia. En 
la figura 5.8 se muestran varias graficas de la distribucion de Weibull para distintos 
valores de a y 6, y como puede observarse, esta distribucion tiene distintos perfiles 
dependiendo del valor de a. Por ejemplo, si a < 1, (5.61) tiene una forma de J 
transpuesta, y si a > 1, la funcion de densidad de Weibull presenta un pico unico. 
La funcion de distribucion acumulativa de Weibull 

F(x; a,d) = ^[ t a ~'exp[-(t/6) a ]dt (5.62) 

Or Jo 

puede obtenerse en forma cerrada mediante la evaluacion directa de la integral en 
(5.62). Esto es: 

F(x; a, 6) = ^-^exp[-(//0)“] 

= 1 - exp[-U/0) a ]. x > 0. (5.63) 

De (5.63), el valor cuantil x q es: 

1 - exp[- (V fl )“] = Q 

x q = -6>[ln(l - q)] Ua 

En particular, la mediana de una variable aleatoria de Weibull es: 

* 0 . 5 = <9[ln(2)] ,/ “. (5.65) 



FIGURA 5.8 Graficas de la funcion de densidad de Weibull para distintos valores de a y 6 
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Los momentos y los factores de una variable aleatoria de Weibull se encuentran 
primero al determinar el /■-esimo momento central alrededor del cero: 


fi'r = E(X r ) = f xj(x; a, 
Jo 

= - fV' 

0 “ Jo 


8)dx 


'exp [~(x/d) a ]dx. 


(5.66) 


En(5.66), sea u = (x/0)“; entonces x = du' ,a y dx = ( d/a)u l/a ' du.El resulta- 
do es: 

fir = £ f (0« ,/a r r -' exp(-u)-u' /a -'du 

0 Jo a 

= d r I w r/ “exp( - u)du 
Jo 

,\ 

(5.67) 


= 0T| 1 + 

a 


De (5.67), la media de X es: 


E(X) = 0r i + - , 

a 


y la varianza de X es el resultado de evaluar: 

Var(X) = 0 2 


r| 1 + -) - r 2 ( 1 + - 

a \ a 


(5.68) 


(5.69) 


Mediante el empleo del mismo procedimiento pueden determinarse el coeficiente 
de asimetria y la curtosis relativa. Estos se encuentran en la tabla 5.12. Los facto- 


TABLA 5.12 Propiedades basicas de la distribucibn de Weibull 


Funcion de densidad de probabilidad 


Parametros 


f(x; a, 6) = ^x a 'exp[ - (x/6) a ] 

U 

x > 0 


Media Varianza 


а, a > 0 

б , 0 > 0 

Valor del Coeficiente 

cuantil de asimetria Curtosis 


aril + -1 e 2 

a 


r i + 


3 - r '(' ♦:) 


In 


W*) = 


ni + i/a) - 3r<i ■+ i/g)r(i +2/«> + 2 m + i/g> 

[r( I + 2/a) - P(1 + l/a)] 5/2 


„ _ r(l + 4/ a) - 4rq + l/a)r(l + 3/a) 6r 2 (l + l/a)ni + 2/a) - 3T*(I + I/a) 

“ 4 * IHI + 2/a) - r’(l + l/a)] 2 + [T(l + 2/a) - T 2 (l + 1/a)] 2 
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TABLA 5.13 Comparaci6n entre las funciones de distribucidn acumulativa de Weibull y 
normal 



a - 

2.25; 6 = 10 

a = 

3.6; 0 = 10 

a = 

5.83; 0 = 10 



Normal 


Normal 


Normal 

X 

Weibull 

(8.858, 4.128)* 

Weibull 

(9.01, 2.788)* 

Weibull 

(9.267, 1.828)* 

0 

0 

0.01578 

0 

0.000619 

0 

0 

1 

0.005608 

0.02872 

0.000251 

0.002052 

0.000001 

0.000003 

2 

0.026395 

0.04746 

0.003041 

0.006037 

0.000084 

0.000034 

3 

0.0644 

0.0778 

0.013025 

0.01539 

0.000894 

0.000302 

4 

0.1195 

0.1190 

0.036259 

0.03593 

0.004775 

0.001988 

5 

0.1896 

0.1762 

0.0792 

0.07493 

0.017425 

0.009903 

6 

0.2716 

0.2420 

0.1470 

0.1401 

0.049616 

0.03673 

7 

0.3612 

0.3264 

0.2419 

0.2358 

0.1175 

0.1075 

8 

0.4541 

0.4150 

0.3610 

0.3594 

0.2384 

0.2451 

9 

0.5457 

0.4880 

0.4956 

0.5000 

0.4179 

0.4404 

10 

0.6321 

0.6064 

0.6321 

0.6368 

0.6321 

0.6554 

11 

0.7104 

0.6985 

0.7557 

0.7611 

0.8250 

0.8289 

12 

0.7785 

0.7747 

0.8545 

0.8599 

0.9447 

0.9332 

13 

0.8355 

0.8413 

0.9236 

0.9236 

0.9901 

0.9793 

14 

0.8814 

0.8925 

0.9652 

0.9641 

0.999184 

0.9952 

15 

0.9171 

0.9319 

0.9865 

0.9842 

0.999976 

0.999155 


* Media y desviacion estandar 


res de forma pueden graficarse como funciones del parametro de forma de la distri- 
buci6n de Weibull (vease [2]). Estas graficas revelan lo siguiente: la distribution de 
Weibull es simetrica solo si a = 3.6; si a > 3.6, la distribucion tieneun sesgo ne- 
gativo y si a < 3.6, se encuentra sesgada positivamente. La curtosis relativa se en- 
cuentra cercana a la de la distribucion normal que es de tres cuando a tiene un valor 
cercano a 2.25 o a 5.83. En la tabla 5.13 se proporciona una comparacion entre las 
funciones de distribucion acumulativa de Weibull y normal, con un a correspon- 
diente a la distribucion de 2.25, 3.6 y 5.83 y con un factor de escala 0 = 10. La con¬ 
cordance parece ser relativamente buena tanto en los valores extremos como en el 
centro, especialmente para a = 3.6 y 5.83. De esta forma, la distribucion de 
Weibull puede aproximarse, de manera adecuada, por una distribuci6n normal cada 
vez que el factor de forma a se encuentre cercano a estos valores. 

En la tabla 5.12 se encuentran resumidas propiedades de la distribucion de 
Weibull. 

Existen dos casos especiales en la distribucion de Weibull que merecen mention 
especial. Cuando el parametro de forma es igual a uno, la distribucion de Weibull (al 
igual que la gama), se reduce a la distribucion exponential negativa. Cuando a = 2 
y el parametro de escala 0 se reemplaza por \/2 <x, la funcion de densidad de 
Weibull (5.61) se reduce a: 

/(.r, a 2 ) = -~2 exp( -x 2 /2a 2 ) .v > 0, (5.70) 
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que es la funcion de densidad de probabilidad de lo que se conoce como distribucidn 
de Rayleigh. 

Ejemplo 5.11 Un fabricante de lavadoras garantiza sus productos contra cual- 
quier defecto durante el primer afto de uso normal. El fabricante ha estimado un 
costo por reparacion de $75 durante el periodo de garanda. Con base en la experien- 
cia, se sabe que el tiempo en que ocurre la primera falla es una variable aletoria de 
Weibull con parametros de forma y escala iguales a 2 y 40, respectivamente. Si el 
fabricante espera vender 100 mil unidades y si, para una misma unidad, se descuenta 
el valor de las reparaciones, se determina el costo esperado de la garanda para el 
fabricante. 

Sea X la variable aleatoria que representa el tiempo que transcurre hasta que se 
presenta la primera descompostura. Por hipbtesis, la funcibn de densidad de proba¬ 
bilidad de X es: 


2 

40 2 


fix ; 2, 40) = x exp[ - (x/40) 2 


x > 0. 


La probabilidad de que la primera descompostura ocurra durante el periodo de 
garanda es igual a la probabilidad de que X sea menor o igual a 12. Mediante el 
empleo de (5.63), esta probabilidad es: 

P(X< 12) = 1 - exp[ - (12/40) 2 ] = 0.0861. 

Por lo tanto, si se supone que la operacion de las lavadoras es independiente entre si, 
se pueden esperar (100 000)(0.861) = 8610 de fallas durante el tiempo de garanda 
con un costo total de $645 750. 


5.7 La distribucion exponencial negativa 

Se ha notado con anterioridad que la distribucion exponencial (negativa) es un caso 
especial de los modelos de Weibull y gama. Ya que es un caso especial de la distribu¬ 
cion gama (Erlang), la variable aleatoria exponencial es el tiempo que transcurre 
hasta que se da el primer evento de Poisson. Es decir, la distribucidn exponencial 
puede modelar el lapso entre dos eventos consecutivos de Poisson que ocurren de 
manera independiente y a una frecuencia constante. Esta distribucion se emplea con 
bastante frecuencia con objeto de modelar problemas del tipo tiempo-falla y como 
modelo para el intervalo en problemas de lineas de espera. Posteriormente se de- 
mostrara que la distribucion exponencial no tiene “memoria”. Es decir, la probabi¬ 
lidad de ocurrencia de eventos presentes o futuros no depende de los que hayan 
ocurrido en el pasado. De esta forma, la probabilidad de que una unidad falle en un 
lapso especifico depende nada mas de la duration de este, no del tiempo en que la 
unidad ha estado en operacion. 
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Definition 5.6 Si una variable aleatoria X tiene una distribution exponential, su 
funcion de densidad de probabilidad esta dada por: 

-exp(-.r/0) x > 0, 0 > 0, 

fix; 0) = J # (5.71) 

- 0 para cualquier otro valor. 

La distribution exponencial se caracteriza por un parametro 6, que representa el 
lapso promedio de tiempo entre dos eventos independientes de Poisson. En el con- 
texto de la confiabilidad, 6 recibe el nombre de tiempo promedio entre fallas, y 1/0 
es la frecuencia de falla. La funcion de distribution acumulativa se obtiene directa- 
mente de los modelos de Weibull o de Erlang y esta determinada por 

P(X < x) = F(x; 0) = 1 - exp( -x/0). (5.72) 

Las expresiones para los valores cuantiles, momentos y factores de forma para esta 
distribution, se obtienen de las correspondientes expresiones para la distribution de 
Weibull con a = 1. Esto es: 

x q = 0ln[!/(l - q)], 

EiX) = 0, 

VariX ) = 0 2 , 

« 3 (A0 = 2, y 
afX) = 9. 

En problemas de confiabilidad, generalmente el interes recae en determinar el 
tiempo de vida promedio de un componente o de un sistema de estos. El problema 
esencial consiste en identificar la distribution de probabilidad de la variable aleatoria 
que, de manera adecuada, proporciona un modelo para el tiempo de falla. En esta 
linea, una cantidad muy util es la funcion de confiabilidad. 

Definition 5.7 Sea T una variable aleatoria que representa el tiempo de vida de un 
sistema y sea f(t) la funcion de densidad de probabilidad de T. La funcion de con¬ 
fiabilidad del sistema a tiempo t, R(t), es la probabilidad de que el lapso de dura- 
cion del sistema sea mayor que un tiempo t dado. De acuerdo con lo anterior, 

Rit) = P(T> t) = 1 - Fit), t > 0. (5.73) 

Otra cantidad muy util para seleccionar una funcion de densidad de probabilidad 
para el lapso de vida medio de una unidad (o sistema) es la frecuencia de falla o fun¬ 
cion de riesgo, que se define de la siguiente forma: 

Definition 5.8 Sean f(t) y R(t) las funciones de densidad de probabilidad y de 
confiabilidad, respectivamente, de una unidad en un tiempo dado t. La frecuencia 
de falla h(t) se define como la proportion de unidades que fallan en el intervalo 
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(t, t + dt) con respecto a las que siguen funcionando a tiempo t, y esta determinada 
por: 

hit) = f{t)/R(t). (5.74) 

Si se conoce la frecuencia de falla, es posible determinar la funcion de densidad 
de probabilidad de la variable aleatoria. Dado que R(t) = 1 - Fit), mediante di- 
ferenciacion con respecto a l, se tiene que R'{t) = - F'U ); pero F'(t) = /(/). 
Como resultado se tiene que la frecuencia de falla puede expresarse como: 

h(t) = -R'(t)/R(t). (5.75) 


Suponiendo que el sistema comenzo a funcionar en t - 0, R{ 0) = 1. Integrando 
ambos miembros de (5.75) desde 0 hasta t, se tiene: 


f g h(x)dx = - f [R'(x)/R(x)]dx 

= -In.[*(/)] + ln[R(0)] 
= -In [R(t)i, 


donde x es una variable muda de integration. Dado que: 

-ln[/?(t)] = [ h(x)dx, 

Jo 

se tiene: 

R(t) = exp h{x)dx . 

Mediante el empleo de (5.74), la funcion de densidad de probabilidad es: 

/(/) = /i(/)exp[- f /i(.v)<ixl. 


(5.76) 


Existen muchos fenomenos fisicos de naturaleza aleatoria que muestran frecuen- 
cias de falla que tienen un parecido a “la curva de la tina de bafio”, tal y como se 
ilustra en la figura 5.9. En el intervalo de tiempo, de 0 a /,, la frecuencia de falla es 
apreciable pero disminuye en valor debido al “sindrome de mortalidad infantil”, 
mismo que sugiere que las primeras fallas pueden tener su origen en defectos de 
fabricacion. Durante el intervalo de t, a t 2 , h(t) es casi constante, pero comienza a 
aumentar de valor despues de t 2 por fallas debidas al desgaste de los componentes. 
Se puede imaginar una frecuencia de falla constante si los componentes se prueban 
inicialmente para detectar fallas por desgaste y se reemplazan antes de t 2 . 

Si la frecuencia de falla 1/0. es constante, la funcion de densidad de probabili¬ 
dad del tiempo de vida medio es la exponencial negativa. Esto es, si h{t) - 1/0- en ~ 
tonces de (5.76) se tiene: 


fit) = - exp 
1/ 


' 1 

0 0 ' 


dx 


= ~ exp( - 1 / 0 ). 

U 
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FIGURA 5.9 Funci6n de frecuencia de falla tipica 


Notese que la proposicion inversa tambien es cierta; si el tiempo de vida medio se en- 
cuentra distribuido de manera exponencial, la frecuencia de falla es constante. Dado 
que la funcion de confiabilidad a tiempo t para un tiempo de vida medio distribuido 
exponencialmente es: 


R(t) = exp( - 1/0), t > 0, 

la frecuencia de falla esta dada por: 


hit) = 


(l/fl)exp j-t/9) 
exp( - 1/0) 


(5.77) 


= \/ 9 , / > 0 . 


Una frecuencia de falla constante implica que la probabilidad de falla en un in- 
tervalo de tiempo determinado, depende de la duracion de este y no del tiempo en 
que el sistema ha estado operando. Esta ultima es la propiedad de “no memoria”. A 
pesar de que el lapso de vida media no se encuentra distribuido de manera exponen¬ 
cial a lo largo de todo el periodo de funcionamiento del componente, el tiempo de 
operacion de un sistema que contiene a estos puede modelarse de manera adecuada 
por una distribucion exponencial si se aflade una selection inicial y una politica de 
mantenimiento adecuada para los componentes. 

Muchos investigadores proporcionan justification empirica para la distribucion 
exponencial en problemas de confiabilidad. El trabajo de Davis [3], quien demostro 
que el lapso de duracion de ciertos componentes electricos puede modelarse de ma¬ 
nera adecuada por una distribucion exponencial, es tipico en este sentido. Como 
ejemplo de este trabajo, la tabla 5.14 contiene una comparacion entre las frecuencias 
observada y teorica para el tiempo de duracion del bulbo V805. El tiempo ae vida 
promedio para este bulbo, con base en los datos que se observaron fue de 179 horas. 
A1 sustituir este valor de 9 en (5.72), se pueden obtener las probabilidades tebricas 
para la distribucion exponencial. 
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TABLA 5.14 Frecuencias observada y esperada para el bulbo V805 


Tiempo de 
duracidn 
(boras) 

0- 80 
80- 160 
160-240 
240-320 
320-400 
400-480 
480-560 
560-700 
700 o mas 

Totales 


Frecuencia 

observada 


317 

230 

118 

93 

49 

33 

17 

26 

20 

903 


Frecuencia 

relativa 


0.3511 

0.2547 

0.1307 

0.1030 

0.0543 

0.0365 

0.0188 

0.0288 

0.0221 

1.0000 


Probabilidad 
deI intervalo 


0.3604 

0.2305 

0.1474 

0.0943 

0.0603 

0.0386 

0.0247 

0.0238 

0.0200 

1.0000 


Frecuencia 

esperada 


325.4 

208.2 

133.1 

85.2 

54.5 
34.8 

22.3 

21.5 

18.1 

903.1 


El argumento para emplear la distribution exponential como modelo para el 
tiempo aleatorio en problemas de lineas de espera es similar al que se emplea en los 
lapsos de duration de un componente. Esto es, si un taller de reparation opera por 
un tiempo suficientemente largo para obtener una condition cercana a] equilibrio, la 
probabilidad de hacer una reparation o que esta se complete en un tiempo determi- 
nado, depended de este ultimo, y no del que haya transcurrido en llevar a cabo la ul¬ 
tima reparation o el completarla. 

A pesar de que la distribution exponential negativa se emplea muchas veces para 
modelar la duration aleatoria de cierto componente, no es la distribution mas apro- 
piada, en el tiempo en que ocurrira una falla, para todos los dispositivos. Existe 
una razOn para creer que el lapso de tiempo que el componente tiene en operation 
afecta su duraciOn. Los modelos mas apropiados en estos casos son la distribution 
de Weibull o la de Erlang. Estas exhiben frecuencias de falla crecientes, decrecientes 
o constantes dependiendo de cuando los valores de los parametros de forma son mas 
grandes que, menores que, o iguales a uno, respectivamente. Por ejemplo, la funciOn 
de confiabilidad para la distribuciOn de Weibull esta determinada por: 

m = exp[-(//«)“] (5.78) 

y la frecuencia de falla es: 

h(t) = at° 70". (5.79) 

Un ejemplo de sistema con una frecuencia de falla decreciente es aquel que mejora 
su funcionamiento con el paso del tiempo. Un ejemplo de este fenOmeno es la dura¬ 
ciOn de una empresa. Entre mas tiempo tenga esta operando con menor frecuencia 
se observara una falla en un intervalo dado de tiempo. 


5.8 La distribution de una funcion de variable aleatoria 

Uno de los ingredientes clave en inferencia estadistica es la distribuciOn de probabili¬ 
dad de la “estadistica” con base en la cual se formula la inferencia. Puesto que las 
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estadisticas son funciones de variables aleatorias, en muchas ocasiones es posible ob- 
tener sus distribuciones si se conocen las variables aleatorias sobre las que estas se 
basan. 

En esta seccibn se examinara una tecnica para determinar la distribution de 
una funcion de variable aleatoria, considerando el caso de una variable aleatoria 
continua. Sea X una variable aleatoria con funciOn de densidad de probabilidad 
fx(x), y sea Y - g(X) una funciOn definida de X. Supongase que es posible resol¬ 
ver y = g(x) para x obteniendo de esta forma la funcion inversa x = g~'(y). Si 
gfx) y g~'(y) son funciones univaluadas de x y y, respectivamente, se dice que la 
transformacion es uno a uno. Esto es, a cada punto en el espacio muestral de X le 
corresponde un punto unico del espacio muestral de Y y viceversa. Si se supone la 
existencia de una transformacion uno a uno y ademas que y = g(x) es una funcion 
creciente y diferenciable de x, se puede determinar la funcion de densidad de proba¬ 
bilidad de X en la siguiente forma: 

Debido a la existencia de una transformacion uno a uno: 

F y (y) = P(Y^y) 

= P[g(X)<y] 

= P[X<g-'(y)]. 

Entonces: 

Fy(y) = F x [g~ l (y)l (5.80) 

A1 establecer la diferencia (5.80) con respecto ay y mediante el empleo de la regia 
de la cadena, se tiene: 

c , , dF. x [g~\y)] dx 

fAy) = -*- Ty 

(581) 

Si gfx) es una funcion decreciente de x, el resultado que se obtiene es el mismo con 
exception de que la derivada de una funcion decreciente es negativa. De esta manera 
se puede formular la siguiente proposicion: 


Teorema 5.2 Sea X una variable aleatoria continua con funcion de densidad de 
probabilidad f x (x> y definase Y = g(X). Si^ = gfx) y x = g~‘(y) son funciones 
univaluadas, continuas y diferenciables y si y = g(x) es una funcion creciente o decre¬ 
ciente de x, la funcion de densidad de probabilidad de Y esta determinada por: 


My) = fx '(y)] 


dx 

dy 


(5.82) 


en donde la cantidad J = \dx/dy\ recibe el nombre de Jacobiano de la transfor¬ 
macion. 


www. FreeLibros. com 



5.8 La chstnbucidn tie una funcidn de variable aleatoria 169 


El teorema 5.2 se obtiene a partir de una tecnica de cambio de variable en una in¬ 
tegral definida, que ya se empleb en varias ocasiones. 

Sea X una variable aleatoria continua con una funcion de densidad de probabili- 
dad f(x; fx, 0, a), donde /x, 0, y a son los paraxnetros de localization, escala y 
forma respectivamente. El efecto del par&metro de forma a puede hacerse mis claro si 
se considera la distribution de la variable aleatoria estandarizada Y = (X - p.)/9, 
la cual no contiene a /x y 0. Mediante el empleo de (5.82), la funcion de densidad de 
probabilidad de Yes: 

My) = efxiOy + fx ,), (5.83) 

ya que la relacion inversa es x - dy + /x y el Jacobiano esta dado por dx/dy = 
0. En particular, sea X una variable aleatoria con distribution gama y cuya funcion 
de densidad se establece por (5.45). La funcion de densidad de Y = X/ 0 es: 

fa(y, a) = ~-T y a ~'exp(-y), y > 0. (5.84) 

r(a) 

De manera similar, si X es una variable aleatoria de Wtibull con funcion de densi¬ 
dad de probabilidad dada por (5.61), la densidad de Y = X/6 es: 

fwiy\ot) = ay a 'e\ p(-y°), y > 0. (5.85) 

Si no existe un parametro de forma ysifxyS son la media y la desviacion estan- 
dar de X, respectivamente, entonces (5.83) dara origen a una funcion de densidad 
libre de parametros con media cero y desviacion estandar uno. Un ejemplo de lo an¬ 
terior es la funcion de densidad de probabilidad normal estandarizada. 

Ejemplo 5.12. Si la variable aleatoria X se encuentra distribuida de manera unifor¬ 
me en el intervalo (0,7r), debe obtenerse la funcion de densidad de probabilidad de 
la funcion Y = c sen (X), para cualquier constante positiva c. 

Notese que la relacion y - c sen (x) es una funcion estrictamente creciente de x 
en el intervalo (0, tt/ 2) y estrictamente decreciente en el intervalo (tt/2, tt). Cuan- 
do la relacion funcional es creciente en alguna parte del dominio de la variable alea¬ 
toria original y decreciente para el resto, la funcion de densidad de probabilidad de 
interns puede obtenerse al tratar cada parte de manera separada y sumar los resulta- 
dos. De acuerdo con lo anterior, los intervalos (0, tt/2) y (tt/2, tt) deben manejar- 
se en forma separada. 

La relacion inversa es: 


x = sen '(y/c). 


y el Jacobiano de la transformacion es: 


dx 

_ 1 

dy 

c 



(r - r) 


■i r. 
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Dado que la densidad de X es: 

f(x) = I/77■ Q < X^TT, 

para el intervalo (0, rr/2), 

/i (>) = — (c 2 — > 2 ) -1/2 Osy<c, 

7T 

y para el intervalo Or/2, nr), 

/ 2 (y) = -(c 2 - y 2 )' l/2 0<y^c. 

rr 

La funcion de densidad de probabilidad de Y es: 

/r(y) =/i(y) + fiiy) 

= — (c 2 - y 2 )~' /2 , 0 s y < c. (5.86) 


Ejemplo 5.13 Sea A - una variable aleatoria distribuida normalmente con media p y 
desviacion estandar <r. Obtener la funcion de densidad de probabilidad de Y = 
exp(X). 

La relacion y - exp(x) es una funcion creciente y diferenciable de x. La relacion 
in versa es x = ln(y), y el Jacobiano es dx/dy = 1/y. Por lo tan to, la densidad de Y 
es: 


y > 0. (5.87) 

La expresion dada en (5.87) es la funcion de densidad de probabilidad de lo que se 
conoce como el modelo log-normal. A pesar de que los parametros de la densidad 
log-normal son las cantidades p. y 0 , estas no representan parametros de localiza- 
cion o escala. Mas bien son la media y la desviaciOn est&ndar de la correspondiente 
variable aleatoria normal. Mientras que la variable aleatoria normal se considera, en 
muchas ocasiones, como la representante del efecto aditivo de muchos errores 
fisicos pequeflos, la variable aleatoria log-normal representa el efecto multiplicativo 
de estos. La distribucion log-normal se emplea en una gran variedad de aplicaciones 
que incluyen el problema de evaluar los efectos de la fatiga sobre materiales. Vease 
[1] para una presentacion detallada de esta distribucion. 

Existe otro metodo para determinar la distribucion de una funcion de variable 
aleatoria que emplea la funcion generadora de momentos. Recuerdese que esta fun¬ 
cion, si existe, determina de manera univoca una distribucion de probabilidad. De 
esta manera, si se encuentra que una variable aleatoria tiene la misma funcion gene¬ 
radora de momentos que la de una distribucion conocida, entonces la funcion de va¬ 
riable aleatoria tiene la misma distribucion. 


My, P-,<r) = 


\/2n 


exp 


cry 


ln(y) - p. 
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Ejemplo 5.14 Sea Z una variable aleatoria distribuida normalmente con media 
cero y desviaci6n estandar uno. Demostrar que la distribucion de: 

y=z 2 

es una distribucion chi-cuadrado con un grado de Iibertad. 

\ 

Por definici6n, la funcibn que genera momentps de Z 2 es: 


m z2 (t) = £[exp(/Z 2 )] 


= J ^exp(tz 2 )f(z)dz 
= (27 t)~' /2 J exp(tz 2 )exp(-z 2 /2)dz 
= (2n)- ,/2 f jxp[-(z 2 /2)(l - 2t)]dz 


r 

z 2 1 

J-« ex p 

2(1-2/)“' 


dz- 


Notese que, excepto por una constante, el integrando de la ultima integral es igual al 
de la funcibn de densidad de probabilidad de una variable aleatoria normal con me¬ 
dia cero y varianza (1 - 2Para hacer el integrando igual a una distribucion nor¬ 
mal con media cero y varianza (1 - 2t )~se multiplica tanto el numerador como 
el denominador por la desviacion estandar (1 - 2/)“ l/2 , que no es otra cosa m&s 
que multiplicar la expresibn por uno. De esta forma, 


m z2 (t) 


1 

r i 

z 2 

(1 - 2/)' /2 J 

— V 2 tt (1 - 2/)“ l/2 CXP 

2(1 - 2t) \ 


= (1 - 2 /)-' /2 , 


dado que el integrando es una funcion de densidad de probabilidad normal y por defi- 
nicibn, la integral desde -a> a o°, es uno. La funcibn generadora de momentos de 
Y = Z 2 es identica a la de la distribucion chi-cuadrado con v = 1 grados de liber- 
tad; (vease (5.60)). Por lo tanto, el cuadrado de la variable aleatoria normal estandar 
tiene una distribucion chi-cuadrado con un grado de Iibertad. 


5.9 Conceptos basicos en la generacion de numeros 
aleatorios por computadora 

Desde el advenimiento de los sistemas de computo de gran escala, los experimentos 
de simulacion se han convertido en tecnicas muy utiles para el analisis de sistemas 
complejos que, muchas veces, se constituyen por muchos componentes interdepen- 
dientes. En la simulacion de estos sistemas surge la necesidad de simular fenomenos 
aleatorios que son caracteristicos de un sistema en especial. Por ejemplo, si un banco 
desea examinar su sistema de servicios al cliente, debe simular el flujo de clientes al 
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banco, asi como tambien el tiempo necesario para llevar a efecto cada operacibn 
bancaria y estos sucesos constituyen eventos aleatorios. 

Para atacar este tipo de problemas se supone, en general, una distribucion de 
probabilidad apropiada para cada fenbmeno y se genera una secuencia de valores 
para la correspondiente variable aleatoria por computadora. Puesto que estas se- 
cuencias se generan mediante el empleo de algoritmos numbricos que pueden re- 
petirse exactamente, estas secuencias de numeros no constituyen, en un sentido 
estricto, numeros aleatorios. Sin embargo, estas secuencias exhiben suficientes pro- 
piedades aleatorias para emplearse con exito en muchas aplicaciones. 

El proposito de esta seccibn no es estudiar las propiedades de los numeros aleato¬ 
rios generados por computadora ni determinar la forma mas eficiente de hacerlo. 
Mas bien el proposito es familiarizar al lector con las posibles formas de generar nu¬ 
meros aleatorios a partir de alguna de las distribuciones de probabilidad, discretas y 
continuas, que se han estudiado. 

La distribucion "niforme sobre el intervalo (0, 1) juega un papel muy importante 
en la generacion de numeros aleatorios por computadora. Para finaiizar se establece 
y demuestra el siguiente teorema: 


Teorema 5.3 Para cualquier variable aleatoria continua X, la funcion de distribu- 
cion acumulativa Fix; 6) con parametro 6 se puede representar por una variable 
aleatoria U, la cual se encuentrauniformemente distribuida sobre el intervalo unitario. 

Demostracion: Dado que por definicion la funcion de distribucion acumulativa de 
X esta dada por: 

F(x; 6) = ( J(t; 0)dt, 

a cada valor de x le corresponde un valor de Fix; 0) que necesariamente se en- 
cuentra en el intervalo (0, l).Ademas, FiX; 6) tambien es una variable aleatoria en 
virtud de la aleatoriedad de X. Para cada valor u de la variable aleatoria U, la fun- 
cibn u = Fix; 6) define una correspondencia uno a uno entre UyX siendo la rela- 
cion in versa x = F~\u). Al tener du = dFix; d) = fix; 0)dx, el Jacobiano de la 
transformacion es: 



lf(x;0)r l = [f(F-'iu);0)]-'. 


La funcion de densidad de probabilidad de la variable aleatoria U, mediante el 
empleo de (5.82), es: 

giu) = fiF-\i,);0)[fiF \it);6)r' 

= 1 , 0 1 . 


La esencia del teorema 5.3 recae en el hecho de que, para muchos casos, es posible 
determinar de manera directa el valor de x que corresponde al valor de u de las va¬ 
riables aleatoria X y U, respectivamente, de manera tal que Fix; 6) = u. Por esta ra- 
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z6n todos los sistemas de computo tienen en su estructura la capacidad de generar 
valores aleatorios a partir de una distribucion uniforme sobre el intervalo unitario 
(0,1). De hecho, muchos paquetes estadisticos para computadora, como SAS, SPSS 
y IMSL, proporcionan al usuario la oportunidad de generar numeros aleatorios a 
partir de una distribucion dada. Se ilustrara el uso del teorema 5.3 en la generacidn 
de numeros aleatorios para algunas distribuciones de probabilidad espedficas. 


5.9.1 Distribucibn uniforme sobre el intervalo (a, b) 

La funcion de densidad de probabilidad es: 

f(x\ a, b) = 1 /(b - a), a < x s b. 

Para generar un numero aleatorio x, a < x < b, primero se genera un valor alea- 
torio u a partir de (0, 1), se iguala a la funcibn de distribucion acumulativa, se in- 
tegra y se resuelve para el limite superior x. De esta forma: 


o 


(b - a)~' 


f 


dt = u 



x = u(b - a) + a, a ^ x ^ b 


(5.88) 


5.9.2 La distribucion de Weibull 
La funcidn de densidad de probabilidad es: 

f(x\ a, 6) = ^x a 'exp[-(jr/^n. x > 0. 

U 

Para generar numeros aleatorios de Weibull x > 0, se resuelve la ecuacibn 


o 


a 

r 



exp[ ~(t/6) a ]dt = u 




exp[-(//0)"l 


u 


y 


I - exp[-(A/0) a ] = it. 



(5.89) 
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Dado que para a = 1, la distribuci6n de Weibull se reduce a la exponencial, pueden 
generarse numeros aleatorios para una distribuci6n exponencial mediante (5.89) 
con a = 1. 

5.9.3 La distribucidn de Erlang 

La funcidn de densidad de probabilidad es: 

fix', a, 6 ) = ^r~^x“ -1 exp(-x/^), x > 0, 

en donde a es un entero positivo. Recuerdese que la variable aleatoria de Erlang es 
la suma de a variables aleatorias independientes distribuidas exponencialmente. Por 
lo tanto, un numero aleatorio de Erlang es la suma de a valores aleatorios exponen- 
ciales, en donde cada valor se genera mediante (5.89). 


5.9.4 La distribucidn normal 

La funcion de distribucion acumulativa normal es: 



no puede resolverse, en forma cerrada, para x. De manera alternativa, puede de- 
mostrarse que si U, y U 2 son dos variables aleatorias independientes con distribu¬ 
cion uniforme sobre el intervalo unitario, entonces 

Z, = ( — 2 lnl/|) l/2 sen(27rt/ 2 ) y ( 5 

Z 2 = (-2 \nU,)' /2 cos(2nU 2 ) 


son dos variables aleatorias normales estandarizadas e independientes. 


5.9.5 La distribucidn binomial 

Para generar numeros aleatorios a partir de una distribucion binomial con funcion 
de probabilidad se considerard lo siguiente: la variable aleatoria binomial es vista 
como la suma de n resultados de un proceso de Bernoulli descrito por: 

p(x; n, p) = - - n - p x i I - p) n x , x = 0, I, 2, ..., n 

(n - x)! x\ 

f I con probabilidad p 

Y = 

(0 con probabilidad (I — p). 

Se puede obtener un numero aleatorio binomial mediante la suma de n de los valo¬ 
res de la variable aleatoria Y, en donde cada valor se determina mediante: 


>’ 


I $\ 0 — u — p 
0 si p < u ^ i , 


(5.91) 
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donde u es un numero aleatorio uniforme sobre el intervalo unitario. Esto es, se ge- 
neran n numeros aleatorios a partir del intervalo unitario, se convierten a unos y ce- 
ros de acuerdo con (5.91) y la suma de los unos en esta secuencia es el numero aleato¬ 
rio binomial. 


5.9.6 .. La distribucibn de Poisson 


Recuerdese que la probabilidad de tener x ocurrencias en un intervalo de tiempo t 
esta definida por: 


, „ (vtYexp(-vt) 

p(x\ t) = -;- 


x = 0, 1,2,..., 


donde v es la frecuencia constante de ocurrencia, y X = vt es el numero promedio 
de estas. Como la ocurrencia en el tiempo de dos eventos independientes de Poisson 
se encuentra distribuida exponencialmente, se puede generar un numero aleatorio 
de Poisson x mediante la generacibn sucesiva de numeros aleatorios exponenciales 
por (5.89) para a = 1. El proceso se continOa hasta que la suma de los valores x + 1 
sea mayor que el intervalo de tiempo t. Por lo tanto, el numero aleatorio de Poisson 
es x. 
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Ejercicios 

5.1. En la misma grafica, dibujar las distribuciones normales N( 0, 5) y jV(0, 4) 

5.2. Sea X — N (50, 10). Determinar las siguientes probabilidades: 
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a) P(X < 40) d) P(X> 35) 

b) P(X < 65) e) P(AQ < X < 45) 

c) P(X > 55) f) P( 38<Af<62) 

5.3. Sea X ~ M200, 20). Determinar las siguientes probabilidades: 

, a) />(185<A'<210) c) P(X > 240) 
b) P(2\S <X< 250) d) P(X >178) 

5.4. Sea X ~ N( — 25, 10). Encontrar los valores de x que corresponden a las siguientes pro¬ 
babilidades: 

a) P(X < .r) = 0.1251 c) P(X > x) = 0.3859 

b) P(X < .r) = 0.9382 d) P(X > x) = 0.8340 

5.5. Sea X ~ 7V(I0, 5). Encontrar los valores de x que corresponden a las siguientes proba¬ 
bilidades: 

a) P(X < x) = 0.05 d) P(X < .r) = 0.01 

b) P(X < x) = 0.95 e) P(X < x) = 0.025 

c) P(X < x) = 0.99 f) P(X < x) = 0.975 

5.6. Sea A" ~ Mg. cr). Determinar la media y la varianza de X si los cuantiles son ,r, M = 
50 y .fo. 8 = 100 

5.7. Una universidad espera recibir, para el siguiente aflo escolar, 16 000 solicitudes de 
ingreso al primer aflo de licenciatura. Se supone que las calificaciones obtenidas por los 
aspirantes en la prueba SAT se pueden calcular, de manera adecuada, por una distribu- 
ci6n normal con media 950 y desviacion estandar 100. Si la universidad decide admitir 
al 25% de todos los aspirantes que obtengan las calificaciones mas altas en la prueba 
SAT, <,cual es la minima calificacion que es necesario obtener en esta prueba, para ser 
admitido por la universidad? 

5.8. Una fdbrica produce pistones cuyos diflmetros se encuentran adecuadamente clasifica- 
dos por una distribucion normal con un diflmetro promedio de 5 cm y una desviacion es- 
tandar igual a 0.001 cm. Para que un piston sirva, su diametro debe encontrarse entre 
4.998 y 5.002 cm. Si el diametro del piston es menor que 4.998 se desecha; si es mayor 
que 5.002 el pist6n puede reprocesarse. ;,Q u e porcentaje de pistones servir4? iQue por- 
centaje sera desechado? ^Que porcentaje sera reprocesado? 

5.9. La demanda mensual de cierto producto A tiene una distribucion normal con una media 
de 200 unidades y desviacion estandar igual a 40 unidades. La demanda de otro produc¬ 
to B tambien tiene una distribucion normal con media de 500 unidades y desviacion es¬ 
tandar igual a 80 unidades. Un comerciante que vende estos productos tiene en su alma- 
cen 280 unidades de A y 650 de B al comienzo de un mes, £cual es la probabilidad de 
que, en el mes, se vendan todas las unidades de ambos productos? Puede suponerse in- 
dependencia entre ambos eventos. 

5.10. El peso de cereal que contiene una caja se aproxima a una distribucion normal con una 
media de 600 gramos. El proceso de llenado de las cajas esta diseflado para que de entre 
100 cajas, el peso de una se encuentre fuera del intervalo 590-610 gramos. <,Cual es el va¬ 
lor maximo de la desviacion estandar para alcanzar este requerimiento? 

5.11. En una tienda de descuento la demanda diaria de acumuladores para automovil se cal- 
cula mediante una distribucion normal con una media de 50 acumuladores que tienen 
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una desviaci6n estandar de 10. En dos dias consecutivos se venden 80 y 75 acumulado- 
res respectivamente. Si estos dias son tipicos, ^qu6 tan probable es, bajo las suposi- 
ciones dadas, vender 80 o mis y 75 o mis acumuladores? 

5.12. Un fabricante de aviones desea obtener remaches para montar los propulsores de sus 
aviones. El esfuerzo a la tensiin minimo necesario de cada remache es de 25 000 lb. Se 
pide a tres fabricantes de remaches (A, B y Q que proporcionen toda la informaci6n 
pertinente con respecto a los remaches que producen. Los tres fabricantes aseguran que 
la resistencia a la tensibn de sus remaches se encuentra distribuida, de manera aproxima- 
da, normalmente con un valor medio de 28 000, 30 000 y 29 000 lb, respectivamente. 

a) iTiene el fabricante la suficiente information para hacer una selection? 

<,Por que? 

b) Supongase que las desviaciones estindar para A, B y C son 1 000, 1800 y 1200, res¬ 
pectivamente. i,Cual es la probabilidad de que un remache producido ya sea por A, B 
o C no reuna los requisitos minimos? 

c) Si usted fuera el fabricante de av : one r . ^podria elegir entre A, B y C, con base en su 
respuesta al inciso bp. <,Por que? 

5.13. Un fabricante de escapes para automoviles desea garantizar su producto durante un 
periodo igual al de la duradon del vehiculo. El fabricante supone que el tiempo de dura- 
ci6n de su producto es una variable aleatoria con una distribution normal, con una vida 
promedio de tres aflos y una desviaciOn estandar de seis meses. Si el costo de reemplazo 
por unidad es de $10, icual puede ser el costo total de reemplazo para los primeros dos 
anos, si se instalan 1 000 000 unidades? 

5.14. El tiempo necesario para armar cierta unidad es una variable aleatoria normalmente 
distribuida con una media de 30 minutos y desviaciOn estindar igual a dos minutos. De- 
terminar el tiempo de armado de manera tal que la probabilidad de exceder este sea de 
0 . 02 . 

5.15. Un periodico llevo a cabo una encuesta entre 400 personas seleccionadas aleatoriamen- 
te, en un estado, sobre el control de armas. De las 400 personas, 220 se pronunciaron en 
favor de un estricto control. 

a) <,Que tan probable resulta el hecho de tener 220 o mis personas a favor del control de 
armas, si la poblacion en este estado se encuentra dividida en opinion de igual manera? 

b) Supongase que se encuesta a 2000 personas teniendo la misma proportion de estas a 
favor del control de armas, que la del inciso anterior. ^Como cambiaria su respuesta 
al inciso a)l 

c) Si el numero de personas encuestadas es de 10 000, £cual es la probabilidad de tener 
una ocurrencia diferente a la del inciso b)l 

5.16. Una prueba de option multiple contiene 25 preguntas y cada una de estas cinco op- 
ciones. ^Cual es la probabilidad de que, al contestar de manera aleatoria cada pregunta, 
mas de la mitad de las respuestas sea incorrecta? 

5.17. Una organization llevo a cabo una encuesta entre 1 600 personas, seleccionadas de ma¬ 
nera aleatoria de toda la poblacion del pais, para conocer su opinion con respecto a la 
seguridad en las plantas de energia nuclear. De este grupo, el 60®/o opino que las plantas 
de energia nuclear tienen muy poca seguridad. Con base en estos resultados iexiste algu- 
na razon para dudar que la poblacion en general tiene una opinion neutral con respecto 
a este asunto? 
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5.18. Sea X una variable aleatoria distribuida binomialmente. 

a) Para n = 15, p = 0.25 y n = 15 y p = 0.5, calcular las siguientes probabilidades: 
P(X = 8), P(X < 3), P(X s 7), P(X > 9), y P(X 2 12). 

b) Aprojdmense los valores de las probabilidades anteriores mediante el empleo de la 
distribucibn normal. 

c) Repetir los incisos a) y b) para n = 25 y comparar los resultados. 

5.19. Sea X una variable aleatoria con distribucibn uniforme sobre el intervalo (a, b). 

a) <,Cu(d es la probabilidad de que X tome un valor que se encuentre a una desviacibn 
estbndar de la media? 

b) iPuede tomar X un valor que se encuentre a dos desviaciones estbndar de la media? 

5.20. Sea X una variable aleatoria con distribucion uniforme sobre el intervalo (a, b). iCual 
es la maxima distancia, en tbrminos de la desviacibn estandar, a la que puede encontrar- 
se un valor X a partir de la media? 

5.21. Sea X una variable aleatoria con distribucibn uniforme sobre el intervalo (a, b). Si E(X) 
= 10 y Var(X) = i2, encontrar los valores de a y de b. 

5.22. Supongase que la concentration de cierto contaminante se encuentra distribuida de ma- 
nera uniforme en el intervalo de 4 a 20 ppm (partes por millbn). Si se considera como to¬ 
xica una concentracion de 15 ppm o mis, £cu&l es la probabilidad de que al tomarse una 
muestra la concentracibn de esta sea toxica? 

5.23. Sea X una variable aleatoria con distribucibn beta y parbmetros a = 3 y )3 = 1. 

a) Graficar la funcion de densidad de probabilidad. 

b) Obtener la media, la varianza, la desviacibn media, el coeficiente de asimetria y la 
curtosis relativa. 

c) <,Cual es la probabilidad de que X tome un valor que se encuentre dentro de una des¬ 
viacibn estbndar a partir de la media? iA dos desviaciones estandar? 

d) Determinar los cuantiles de esta distribucibn. 

5.24. Si los parametros de la distribucibn beta son enteros, puede demostrarse que la funcion 
de distribucibn acumulativa beta se encuentra relacionada con la distribucibn binomial 
en la siguiente forma: 

P(X<p) = /,(«,/3) = ' P)-', 

en donde n = a + /3 - 1 y 0 < p < 1. Si A' es una variable aleatoria con una 
distribucibn beta con parametros a = 2 y f3 = 3, emplear la relacibn anterior para 
obtener P( X < 0.1), P(X < 0.25), y P(X < 0.5). 

5.25. Tomando como referencia el ejercicio anterior, determinar la probabilidad de que X 
tome un valor que se encuentre dentro de un intervalo igual a una desviacibn estbndar 
de la media y, posteriormente, de un intervalo igual a dos desviaciones estandar. 

5.26. La proportion de unidades defectuosas en un proceso de fabricacion es una variable 
aleatoria que se encuentra aproximada por una distribucibn beta con a = 1 y (3 = 20. 

a) iCual es el valor de la media y de la desviacibn estandar? 

b) iCu&l es la probabilidad de que la proportion de articulos defectuosos sea mayor que 
un 10%? iMayor que un 15%? 
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5.27. Aproxime su respuesta al inciso b) del ejercicio anterior mediante el empleo de la aproxi- 
macibn normal dada por la expresi6n (5.44). 

5.28. La competencia en el mercado de unacompaflla de computadoras varia de manera alea¬ 
toria de acuerdo con una distribuci6n beta con a = 10 y /8 = 6. 

a) Graficar la funcibn de densidad de probabilidad. 

b) Encontrar la media y la desviacibn estAndar. 

c) Obtener la probabilidad de que la competencia en el mercado sea menor que la media. 

d) Encontrar la probabilidad de que la competencia en el mercado se encuentre dentro 
de una desviacibn estandar de la media y, posteriormente, de un intervalo igual a dos 
desviaciones estandar de la media. 

5.29. Sea X una variable aleatoria con distribucibn gama con a = 2 y 0 = 50. 

a) iCual es la probabilidad de que X tome un valor menor a! valor de la media? 

b) iCual es la probabilidad de que X tome un valor mayor de dos desviaciones estandar 
con respecto a la media? 

c) iCuAl es la probabilidad de que X tome un valor menor al de su moda? 

5.30. Sea X una variable aleatoria con distribution gama y a = 2 y 0 = 100. 

a) Graficar la funcibn de densidad de probabilidad. 

b) Encontrar la probabilidad de que, primero, X tome un valor dentro de un intervalo 
igual a una desviacibn estandar de la media y, posteriormente, de un intervalo igual a 
dos desviaciones estandar de la media. 

c) i,C6mo cambiarian sus respuestas a la parte b) si 0 = 200? 

5.31. La edad a la que un hombre contrae matrimonio por primera vez es una variable aleato¬ 
ria con distribution gama. Si la edad promedio es de 30 aflos y lo mas comun es que el 
hombre se case a los 22 aflos, encontrar los valores de los parametros ay 9, para esta 
distribution. 

5.32. La information que a continuation se presenta es una tabulation parcial de la funcibn 
gama incompleta tal como se encuentra definida por (5.55) para a = 16. 


u 2 

2.5 

3.0 

3.5 

4.0 

4.5 

/(«, 15) 0.0082 

0.0487 

0.1556 

0.3306 

0.5333 

0.7133 


u 5.0 

5.5 

6.0 

6.5 

7.0 

7(w, 15) 0.8435 

0.9231 

0.9656 

0.9858 

0.9946 


Para 0 = 10, comparar estas probabilidades con las que se proporcionaron al emplear 
una aproximacion normal. 

5.33. Mediante el empleo de la funcion generadora de momentos de la distribucion gama, en¬ 
contrar expresiones para la media y la varianza. 

5.34. La duracibn de cierto componente es una variable aleatoria con distribution gama y pa- 
rametro a = 2. 

a) Obtener la funcion de confiabilidad. 

b) Para 6 = 20, obtener la frecuencia de falla y graficarla como una funcion de t. 

c) Si 6 = 20, £cual es la confiabilidad del componente en / = 80? 

5.35. Para armar un articulo se necesitan cuatro etapas. Si el tiempo total necesario para ar- 
mar un articulo, en horas, es una variable aleatoria con distribucibn gama y parAmetro 
de escala 0=2, icual es la probabilidad de armar un articulo en menos de 15 horas? 
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5.36. Sea X una variable aleatoria con distribucibn de Weibull y parametros a = 2y 9 = 20. 

a) Graficar la funci6n de densidad de probabilidad. 

b) Obtener la probabilidad de que X tome un valor mayor que la media. 

c) Obtener la probabilidad de que X tome un valor que se encuentre en un intervalo 
igual a una desviacibn estindar, y despues en un intervalo igual a dos desviaciones es- 
t£ndar de la media. 

5.37. El tiempo de duracibn de un sistema se encuentra aproximado por una distribucibn de 
Weibull con a = 2 y 0 = 50. 

a) Obtener la media y los deciles de esta distribucibn. 

b) Obtener la confiabilidad de este sistema en / = 75. 

5.38. Un sistema est4 formado por dos componentes independientes A y B. El sistema perma- 
necera operando mientras uno o ambos componentes funcionen. Si el tiempo de vida de 
la componente A es una variable aleatoria de Weibull con a = 1/2 y d = 10, ysiel 
tiempo de vida de B es tambien una variable de Weibull con a = 2 y 0 = 12. <,cucil es la 
probabilidad de que el sistema trabaje m4s de 20 horas? 

5.39. Sea X una variable aleatoria con distribucibn exponencial. 

a) iCual es la probabilidad de que X tome un valor mayor que la media? 

b) Curies son las probabilidades de que X tome un valor que se encuentre en un interva¬ 
lo igual a una desviacibn estandar, primero, y en un intervalo igual a dos des¬ 
viaciones estandar de la media? 

5.40. Si la frecuencia con que falla un componente es constante y la confiabilidad de este tiene 
un valor en t = 55 de 0.4, 

a) Obtener la funcion de densidad de probabilidad. 

b) Obtener la confiabilidad del componente para t = 100. 

5.41. Un dispositivo tiene una frecuencia de falla constante h(t) = 10 : por hora. 

a) iCual es la confiabilidad del dispositivo para t = 200 horas? 

b) Si 500 de estos dispositivos fallan de manera independiente, £cual es el numero espe- 
rado de fallas entre estos, despues de 200 horas? 

5.42. El compresorde una unidad de aire acondicionado tiene una frecuencia de falla h(t) = 

2 x 10' 8 / ■ por hora. 

a) iCual es la funcion de confiabilidad del compresor? 

b) iCual es la confiabilidad del compresor para / = 15 000 horas? 

c) iCual es la vida media del compresor? 

d) iCual es la mediana de su duracion? 

5.43. Sea X una variable aleatoria con distribucibn uniforme en el intervalo (0, 1). Demostrar 
que la variable aleatoria Y = -- ln(A') tiene una distribucibn chi-cuadrado con dos 
grados de libertad. 

5.44. Si X es una variable aleatoria con una distribucibn exponencial y parametro 8, obtener 
la distribucibn de Y = (X - 9)/8. 

5.45. Si X es una variable aleatoria con una distribucibn de Weibull y parametros a y 8, obte¬ 
ner la distribucibn de Y = X a . 

5.46. Seleccione una distribucibn de probabilidad discreta y una continua de la seccion 5.9 y 
genere dos muestras aleatorias de 50 numeros aleatorios cada una. Para cada caso agru- 


www. FreeLibros. com 



Apendice 181 


pe los datos y obtenga las frecuencias relativas. Calcule la media y la desviacibn est4ndar 
de cada una de las muestras y compare los resultados con los que se obtienen de manera 
teorica. 


APENDICE 

Demostraci6n de que la expresidn (5.1) es una funcidn de densidad de probabilidad. 

El que la funcion sea no negativa se satisface, ya que f(x\ p, a) > 0 para -* < x 
<oc, -oc < jx < * y o->0. Para demostrar que: 


sea: 



; p, cr)dx 


1. 


1 = 


-i-f 

\Jllt (T ' ~ x 


exp 


-(-v 


m) 2 /2c r 



el valor de la integral y apllquese la transformation lineal y = (x - p)/<r de ma¬ 
nera tal que x = cry + p y dx — crdy. Esto da como resultado: 

l = — 4= f exp(-y 2 /2 )dy. 

\/2tt J " x 

Si puede demostrarse que/ 2 = 1, puede deducirse que 7 = lpuestoque f(x\ p, 
cr) tiene una valor positivo. De acuerdo con lo anterior: 


l 2 


V2 

J_ 

277 


rJ- 

u: 


exp(-y 2 /2)dy • —== 

\2 7T 

exp[-(y 2 + z 2 )/2 


J exp(-z : /2)dz 
] dydz. 


en donde se ha escrito el producto de las dos integrates como una doble integral ya 
que las funciones de z son constantes con respecto a y y viceversa. A1 cambiar de 
coordenadas rectangulares, representadas por x y y, a coordenadas polares r y 6, en 
donde y = r cos 6 y z = r sen 6. Esto es: 

•> ? 7 _ "> 7 

y~ + z = r - cos 6 + r'sen" 0 = r*, 

y el elemento de area r/yc/z, en coordenadas rectangulares se reemplaza por rdrdO en 
coordenadas polares. Dado que los limites (—ac, x) tanto paray como para zgene- 
ran el piano completo yz, el piano correspondiente arya 6 se genera mediante el 
empleo de los limites (0,2 tt) para 9 y (0,^) para r. De esta forma se tiene: 


I 2 = 


i r 2 " r 

— exp( - r/2)rdrd9 

Z7 T Jo Jo 
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. j - r-r 

277 JO Jo 


exp( - r 2 /2)rdr 


= — . [_ eX p(-r 2 /2)] 

Lit 0 0 


y, por lo tanto, (5.1) es una funci6n de densidad de probabilidad. 


APENDICE 

Demostracibn del teorema 5.1 

La demostracibn que aqui se presenta se basa en el hecho de que una funcibn genera- 
dora de momentos define, de manera unica, a una distribucibn. Se demostrara que 
la funcion generadora de momentos de Y tiende a una distribucibn normal conforme 
h —x es una variable aleatoria binomial: 


m x {t) = [(1 - p) + pe'T 


Entonces: 


t(X - np)/\fnp{ 1 - p) 


m Y (t) = E(e ,y ) = ^jexp t(X - np)/\/np{\ - p)jj 

= exp -npt/\Jnp( 1 - p) £|expj^/A'/V«M l _ P) |- 

donde £'|expJ^tA r /V«p(l - p) | es la funcion generadora de momentos deacon 
argumento t/\/np(\ - p). De esta forma se tiene: 

m Y (t) = expj^ -npt/\Jnp(\ - p) |(1 - p) + p exp t/\fnp(\ - p) | ; 
pero: 

exp^-npt/\/np(\ - p) = jexp -pt/y/np(\ - p) | 

y: f [ _1 

m Y (t) = j(l - p)exp -pt/\Jnp( 1 - p) 


+ p exp 


t _ Pi 1" 

^np{\ - p) \/np( 1 - p) JJ 


= 1 (1 - p)exp - pt/\Jnp{\ - p) 


+ p exp (1 -p)l/\/np(\ - p) > . 
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En la ultima expresion, al expander ambas funciones exponenciales en una serie 
de potencias, se tiene: 


(1 - p)exp 


~pt/\Jnp( 1 - p) 


, (1 - P)pt . (1 - P)P 2 t 2 

= (1 ~ P) - : +- 


+ terminos en (-!)*(- 


y/np( 1 - p) 2/ip(l - p) 

k/2 

, k = 3,4, ... 


(1 - P)P* , P‘ 2 

= (1 - p) - - - = + — 

\Jnp{\ - p) 2n 


+ terminos en (- 1) I - 
\n 


k/2 


p exp 


(1 - p)t/y/np{ 1 - p) 


P + 


+ terminos en - 
\n 


k = 3,4, ... 

(1 - p)pt , (1 - pfpt 2 


+ 


P + 


\/V( l - P) 2np(l - p) 

| \ k/2 


+ 


k = 3,4, ... 

(1 - p)pt , ( 1 - p)t 2 
In 

k = 3,4. 


V«pd - P) 


. . :n* /2 

+ terminos en I - 


Al sustituir los resultados anteriores en m Y (t) y agrupar terminos, 


m Y (t) 


1 + -—t- terminos en 
In 


en- 


k = 3,4. 


Dado que todos los terminos que contienen a (l/n)* /2 , k = 3, 4, ..., tienen ex- 
ponentes mayores que uno, puede factorizarse el termino 1 /n. De esta forma se tiene 
que: 


>n Y (t) 


1 r r 



+ terminos en 


(\) 

a- 21/2 

(;) 



A = 3,4, ... . 


Por definicion: 


lim 1 



entonces, conforme n — oo, la ultima expresion para m Y (t) es identica a esta forma, 
con u representando a todo lo que se encuentra entre parentesis de esta expresion. 
Pero conforme n — oo, todos los terminos de u, excepto el primero, tienen un valor 
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de cero, dado que todos tienen potencias positivas de n en sus denominadores. De 
acuerdo con lo anterior. 

lim m Y (t) = exp(r/2). 

que es la funcion generadora de momentos de la distribution normal estandar. 
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CAPITULO SEIS 

Distribuciones conjuntas 
de probabilidad 


6.1 Introduction 

En los capitulos anteriores se consideraron conceptos probabilisticos tomando en 
cuenta una variable aleatoria a la vez. Sin embargo, muchas veces resulta de interes 
medir mas de una caracteristica de algun fenomeno aleatorio. Por ejemplo, en un 
proceso de production en el que se tiene determinado numero de articulos produci- 
dos en un tiempo definido, es muy comun que el interes no solo recaiga en el numero 
de articulos que se encuentran listos para su venta inmediatamente despues de su 
fabrication, sino tambien en el numero que, despues de reprocesarse, cae en la 
categoria anterior o en el numero de articulos que seran desechados. Otro ejemplo 
puede ser que, al estudiar la contamination del agua en general, se mida la con¬ 
centration de varios contaminantes presentes en esta. De los ejemplos anteriores sur¬ 
ge la necesidad de estudiar modelos de probabilidad que contengan mas de una va¬ 
riable aleatoria. Estos modelos reciben el nombre de modelos multivariados, mientras 
que los modelos con una sola variable reciben el nombre de univariados. En este capi- 
tulo se examinar&n conceptos generales para distribuciones de probabilidad discretas y 
continuas con dos variables aleatorias. La extension de estos conceptos a un mayor 
numero de variables aleatorias resulta directa. 


6.2 Distribuciones de probabilidad bivariadas 

En esta section se consideraran las definiciones pertinentes para distribuciones, tan- 
to discretas como continuas, de dos variables aleatorias. 

Definicion 6.1 Sean X y Y dos variables aleatorias discretas. La probabilidad de 
que X = xy Y = y esta determinada por la funcion de probabilidad bivariada 


p(x, y) = P(X = x, Y = v). 
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en donde p(x, y) 5s 0 para toda x, y, de X, Y, y l x l y p(x, y) = 1. La suma se 
efectua sobre todos los valores posibles de x y y. 

Con base en la definicion 6.1, la funcion de distribucion acumulativa bivariada 
es la probabilidad conjunta de que X x y Y *£ y, dada por 

F(x, y) = P(X ^x, Y^y) = £ S P( x h Y,)- (6-1) 

x, vj^v 

La expresion anterior es una extension del caso univariado. La funcion de probabili¬ 
dad conjunta de dos variables aleatorias da origen a las probabilidades puntuales 
conjuntas, y la funcion de distribucion bivariada es una funcion escalonada cre- 
ciente para cada probabilidad puntual distinta de cero, de manera tal que X = x y 

Y = y. 

Ejemplo 6.1 Con base en la experiencia se sabe que la proporcion de unidades uti¬ 
les producidas por un proceso de manufactura esp,, y las proporciones de unidades 
envfadas a reprocesar y desechadas, son p 2 y P y respectivamente. Si se supone que el 
numero de unidades que se produce en un lapso dado es n y que ademas estas consti- 
tuyen un conjunto de ensayos independientes de manera que p i + p 2 + Pi = 1, 
desarrollar una expresion para la probabilidad de tener, de manera exacta, x x , x 2 y 
x 3 unidades utiles, reprocesables y desechadas, respectivamente. 

Lo que se pide es una extensibn de la distribucibn binomial univariada. A pesar 
de que existen tres resultados mutuamente excluyentes (util, reprocesable y desecha- 
do), solo es necesario definir dos variables aleatorias dado que, para cualquier nu¬ 
mero espedfico de cada una, la suma de las tres es n. Por consiguiente, sean X y Y las 
variables aleatorias que representan el numero de unidades utiles y reprocesables, 
respectivamente, del total de unidades n. De esta manera, si X = x y Y = y, en- 
tonces el numero de unidades que deben desecharse es n —x —y. Por la hipotesis de 
independencia, la probabilidad de tener una secuencia especifica de resultados es 

P\pi( 1 -Pi- P 2 ) n - X ~ y . 

Dado que existen n\/[x\y\(n - x - y)!] formas igualmente probables para que 
ocurra una secuencia de resultados especifica, la probabilidad conjunta de tener, de 
manera exacta, x, y, y n -x-y unidades utiles, reprocesables y desechadas, respecti¬ 
vamente, es 


n ! 

p(x,y; «, Pl ,p 2 ) = -- ~p x ,p 2 (\ - Pt - P 2 )"~ x \ 

xly:(n-x~y)l 

x,y = 0,1,2 . n, (6.2) 

en donde p 3 = 1 - p t - p 2 . La expresion (6.2) es la funcion de probabilidad 
conjunta de lo que se conoce como la distribucion trinomial. Los parametros de esta 
distribucion son n, p x y p 2 , dado que p 3 se determina de manera exacta si se conocen 
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p, y p 2 . La distribution trinomial se ha aplicado, de manera extensa, a situationes en 
que existen tres resultados distintos, como en las encuestas sobre la preferentia del 
consumidor en relation a tres marcas comerciales o en encuestas de tipo politico en 
que se pide la opinion con respecto a tres candidatos. 

Si existen k resultados distintos excluyentes con probabilidades p x , p 2 ,... p k , 
respectivamente, entonces para n ensayos independientes, la distribucion trinomial 
se generaliza para originar la distribucidn multinomial cuya funcion de probabilidad 
es: 

n\ 

p(x t ,x 2 , ...,x k _ x ; n, pt, p 2 , p k _ x ) = ——-- p x x 'pf ... p\ k 

x,!jt 2 ! ... Jt t ! 

jc, = 0, 1, 2, ..., n for / = 1,2, ..., k, (6.3) 
endonde x k = n - x x - x 2 - — - y p k = 1 - p x - p 2 -- p k - 

Definition 6.2 Sean Xy Y dos variables aleatorias continuas. Si existe una funcion 
/( x, y) tal que la probabilidad conjunta: 

P(a < X < b, c < Y < d) = J J /( x, y)dydx 

para cualquier valor de a, b, c, y d en donde /( x, y) > 0, - < x , y < °o ? y 

/-ocf -oc f(x, y)dydx = 1, entonces/(jc, y) es la funcion de densidad de probabili¬ 
dad bivariada de X y Y. 

La funcion de densidad de probabilidad de dos variables aleatorias continuas X y 
Y es una superficie en el espacio de tres dimensiones donde el volumen por debajo de 
esta y por encima de un rectangulo especifico a < X < b y c < Y < dt s igual a la 
probabilidad de que las variables aleatorias tomen valores iguales a los puntos que se 
encuentren dentro del rectangulo. 

La funcion de distribucion bivariada acumulativa de X y Y es la probabilidad 
conjunta de que X x y Y y, dada por: 

P(X L *£ y) = F(x, y) = J ^| f(u, v)dvdu. (6.4) 


Por lo tanto, la funcion de densidad bivariada se encuentra diferenciando F(x. y) con 
respecto ary y; es decir. 


fix, y) 


d 2 F(x, y) 
dxdy 


(6.5) 


Ejemplo 6.2 Sean Xy Y dos variables aleatorias continuas con funcion de densi¬ 
dad de probabilidad conjunta dada por: 

((x + y) 0«x,y *£ 1, 

f< x , y) = i , . . 

(0 para cualquier otro valor 
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Graficar la funcion de densidad de probabilidad conjunta, determinar la funcion de 
distribution acumulativa conjunta y obtener la probabilidad conjunta de que X *£ 
1/2 y y « 3/4. 


La grafica de la funcion de densidad conjunta se ilustra en la figura 6.1. Notese 
que f{x, y)es una funcion de densidad de probabilidad conjunta, dado que 


IL< X + rW* ‘ l(*y + t) * = 1 


Entonces 

F(x,y) = [[(« + v)dvdu 
JoJo 

De cjta c onna se tiene 


-[ 


x + X -]dx = 1. 
2 ) 


uy + — ]du - ,vy(.v + y)/2, 0 « .v, y 1. 


Ademas 


F(l/2, 3/4) 





= 15/64. 
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y 


d 2 F(x, y) 
dx dy 


= x + y = f(x, y). 


6.3 Distribuciones marginales de probabilidad 

Es posible determinar varias distribuciones marginales para cualquier distribution 
de probabilidad que contenga mas de dos variables aleatorias. Por ejemplo, si Xy Y 
son variables aleatorias discretas, la suma de la funcion de probabilidad bivariada 
sobre todos los valores posibles de Y dara origen a la funcion de probabilidad univa- 
riada de X. Por otro lado, si X y Y son variables aleatorias continuas, la integration 
de la funcion de densidad de probabilidad bivariada sobre el intervalo completo de 
variation de Y generara la funcion de densidad de probabilidad univariada de X. De 
acuerdo con lo anterior, se formulan las siguientes definiciones: 


Definition 6.3 Sean X y Y dos variables aleatorias discretas con una funcion de 
probabilidad conjunta p{x, y). Las funciones marginales de probabilidad de Xy 
de Y est&n dadas por 

P-xix) = 2 Pix,y) 

y 

y 

pAy) = 2 p(x,y). 


respectivamente. 

Definition 6.4 Sean X y Y dos variables aleatorias continuas con una funcion de 
densidad de probabilidad conjunta /(. x, y). Las funciones de densidad de probabili¬ 
dad de X y de Y estan dadas por 


y 


fxix) = 



fviy ) = j f(X' y)dx, 

respectivamente. 

Para variables aleatorias continuas conjuntas, si se conoce la funcion de distribu¬ 
cion acumulativa Fix, y), las distribuciones acumulativas marginales de X y Y se ob- 
tienen de la siguiente forma: 

PiX « x) = F x (x) = f Jit, y)dydt, 
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f'x(x) = f x (t)dt = F(x, *). 


De manera similar 


= F K (y) 


- ti: 


/(*, t)dxdt = f r (t)dt = F («=, y). (6.7) 


Asi puede determinarse la distribucion acumulativa marginal de X dejando que 
Y tome un valor igual al limite superior de la funcion de distribucion conjunta de X 

y r. 

Ejemplo 6.3 Sean X y Y dos variables aleatorias continuas con una funcion de den- 
sidad de probabilidad conjunta: 


fix, y) = 


3x(l - xy) 0 *£ x, y ^ 1, 


para cualquier otro valor. 


Obtener las distribuciones de densidad marginal y acumulativa de X y Y. 

La funcion de densidad marginal de X es 

fxix) = 3 j o .v(l - xy)dy = 3 (xy - = 3x(l-^j. 

De manera similar para Y 

friy) = 3 J g *0 - xy)dx = 3 fy - = (3 - 2y)/2. 

La distribucion acumulativa conjunta de X y Y es 

F(x. y) = 3 ( j u( 1 - uv)duchi = 3 J g (uy - 

= ,v 2 y(3 - xy)/ 2, 0 =s x, y *£ 1. 

Por lo tanto, las distribuciones acumulativas marginales de X y Y estan dadas por 

F x (x) = F(x, 1) = ,r : (3 - ,r)/2. 0 « x « 1. 


F r (y) = F( 1, y) - y(3 - y)/2. 0 « v ^ 1, 


respectivamente. 
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F x (x) = f x U)dt = F(x, x). 


De manera similar 


P(Y^y) = F r (y) 




t)dxdt = f Y (t)dt = F (<*, y). (6.7) 


Asi puede determinarse la distribucion acumulativa marginal de X dejando que 
Y tome un valor igual al limite superior de la funcion de distribucion conjunta de X 

y Y. 

Ejemplo 6.3 Sean X y Y dos variables aleatorias continuas con una funcion de den- 
sidad de probabilidad conjunta: 


fix. y) = 


3x(l - xy) 0 < x, y =£ I, 


para cualquier otro valor. 


Obtener las distribuciones de densidad marginal y acumulativa de X y Y. 

La funcion de densidad marginal de X es 

fxix) = 3 J o x(l - xy)dv = 3 |xy - = 3x | 1 - ^j. 

De manera similar para Y 

friy) = 3^41 - xy)dx = 3 = (3 - 2y)/2. 

La distribucion acumulativa conjunta de X y Y es 

Fix , y) = 3 || //(I - nv)dvdu = 3 | ^ uy - 

= jv 2 y(3 - xy)/ 2, 0 .v, y « 1. 

Por lo tanto, las distribuciones acumulativas marginales de X y Y estan dadas por 

F x (x) = F(x, i) = ,v : (3 - x)/2. 0 «£ -v « I. 


F r (y) = /’(l. y) = y(3 - >•)/2, O^ysl, 


respectivamente. 
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6.4 Valores esperados y momentos para distribuciones bivariadas 

En esta section se trataran los conceptos de valor esperado y momentos para distri¬ 
buciones conjuntas de probabilidad. 


Definicion 6.5 Sean X y Y dos variables aleatorias que se distribuyen conjunta- 
mente. El valor esperado de una funcion de X y de Y, g{x, y), se define como 

E\g{X, Y)] = 22 g(x, y)p(x, y) 

x y 


si X y Y son discretas, o 


*ae rx 

E\g{X,Y)\= g(x,y)f(x,y)dydx 

-* — * 


si Xy Y son continuas, en aondepCc, y)yf(x, y)son las funciones de probabilidad y 
de densidad de probabilidad conjuntas, respectivamente. 

Sin perdida de generalidad, se restringira la presentacion al caso continuo. 
Como consecuencia de la definicion 6.5, el r-esimo momento de X alrededor del cero 
es 


De manera similar 


E(X') 


f J x r f(x.y)dydx 

J ^x r f x (x)dx. 


*ac 

E{r) = yJr(y)dy. 

J —X 


( 6 . 8 ) 


(6.9) 


El r y s-esimo momento producto de X y Y alrededor del origen es: 

E(X r F) = f J _ x xyfix, y)dydx, 
y alrededor de las medias es 


( 6 . 10 ) 


E{(X - p x Y(Y - p Y y 


• ■ LI 


(.r - p x Y (y - p-yf fix, y)dydx, (6.11) 


en donde r y s son enteros, no negativos. Notese que el r-esimo momento de X alre¬ 
dedor del cero se obtiene de (6.10) con s = 0. De manera similar, el r-esimo momen¬ 
to central de X puede determinarse a partir de (6.11) con 5 = 0. 

De particular importancia es el momento producto alrededor de las medias cuan- 
do r = s = 1. Este momento producto recibe el nombre de covarianza de X y Y, y se 
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encuentra definido por 

Cov(X, Y) = E{(X - p x ){ Y - p Y )}. (6.12) 

A1 igual que la varianza, que es una medida de la dispersion de una variable aleato- 
ria, la covarianza es una medida de la variabilidad conjunta de X y de Y. De esta 
forma, la covarianza es una medida de asociacion entre los valores de X y de Y y sus 
respectivas dispersiones. Si, por ejemplo, se tiene una alta probabilidad de que valo¬ 
res grandes de X se encuentren asociados con valores grandes de Y, la covarianza 
sera positiva. Por otro lado, si existe una alta probabilidad de que valores grandes de 
X se encuentren asociados con valores pequeftos de Y o viceversa, la covarianza sera 
negativa. Se demostrara posteriormente que la covarianza es cero si X y Y son 
estadisticamente independientes. 

Desarrollando el miembro derecho de (6.12) se tiene 

E{(X - p x )(Y - p Y )} = E[XY - Xpy - Yp x + p x p Y ) 


de esta forma 


= E(XY) - p x py\ 

Cov( X, Y) = E(XY) - E(X)E(Y). 


(6.13) 


Si la covarianza de X y de Y se divide por el producto de las desviaciones estan- 
dar de X y de Y, el resultado es una cantidad sin dimensiones que recibe el nombre 
de coeficiente de correlation y que se denota por p(X, Y):* 

p( X, Y) = Cov(X, Y)/a x Oy. (6.14) 

Se puede demostrar que el coeficiente de correlacion se encuentra contenido en el in- 
tervalo - 1 1. De hecho p es la covarianza de dos variables aleatorias estan- 

darizadas X' y Y' en donde X' = (X - p x )/<r x y Y' = (K - p y )/a y . Esto sig- 
nifica que el coeficiente de correlacion es solo una medida estandarizada de la aso¬ 
ciacion lineal que existe entre las variables aleatorias X y Y en relacion con sus 
dispersiones. El valor p — 0 indica la ausencia de cualquier asociacion lineal, 
mientras que los valores - 1 y + 1 indican relaciones lineales perfectas negativa y 
positiva, respectivamente. En este punto es necesario seflalar que debe rechazarse 
cualquier otra interpretacion de la palabra “correlacion”. Despues se expondra con 
detalle el coeficiente de correlacion cuando se estudie el analisis de regresion. 


Ejemplo 6.4 Sean X y Y dos variables aleatorias con una funcion de densidad con- 
junta de probabilidad. 


,/t-v. v) 



+ y)exp( — x) 


10 


A- > 0. 0 < y < 1 . 


para cualquier otro valor. 


* Se omitira la identificacion de las variables aleatorias cuando sea necesario. 
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Obtener la covarianza y el coeficiente de correlation de X y de Y. 
Si se toman los valores esperados apropiados, se tiene 


E(X) = J f () f o Or 2 + xy) exp( — x)dydx 


= ^j n (r 2 + ,v/2)exp (-x)dx 

=iL x2 


exp (-x)dx + - .t exp ( 
3 Jo 


2fl3) r(2) 

3 + 3 

= 5/3; 


E(X') = 


3 Jo Jo 


(.v 3 + .v : y) exp (-x)dydx 


= - x* exp( -x)dx + - ,v : exp(-.r)J.r 


3 Jo 

= 2H4) H3) 

3 + 3 

= 14/3; 


3 Jo 


Y 1 = I (xy + y 2 ) exp( -x)d\dx 
3 J« Jo 


3 Jo 


-v exp( -x)dx + - exp (-x)dx 

9 Jo 


_ H2) 2 

3 + 9 

= 5/9; 

2 I' 

E(Y 2 ) = - (.vv 2 + r) exp( -x)dvdx 

t Jo Jo 


1 c r - 


1 


= 7: I .V exp( x)dx + 7 I exp(-.v)</.v 
9 Jo 6 Jo 

21(2) I 
9 + 6 

= 7/18; 
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E(XY) = j J u J o (-O' + xy 2 ) exp (-x)dydx 


-if 

3 Jo 


If 

9 Jo 


r exp (-x)dx + - xexp(-x)dx 


_ R3) t 2R2) 

3 9 

= 8/9. 

Por lo tanto 

Cov(X,Y ) = E(XY) - E{X)E(Y) = 8/9 - (5/3)(5/9) = -1/27. 
Dado que 

Var(X) = E(X 2 ) - E\X) = 17/9 


y 

Var(Y) = E(Y 2 ) - E 2 (Y) = 13/162, 
el coeficiente de correlacion es 


P(X, Y) = 


-1/27 

Vd7/9)(13/162) 


-0.0951. 


:> 

'f 


6.5 Variables aleatorias estadisticamente independientes 

En el capltulo dos se menciono que dos eventos son estadisticamente independientes si 
su probabilidad conjunta es igual al producto de sus probabilidades marginales. En esta 
seccion se extendera el concepto de independencia a variables aleatorias. A fin de asegu- 
rar la consistencia de la definition debe insistirse que para variables aleatorias estadis¬ 
ticamente independientes, la probabilidad conjunta P{a < X < b, c < Y < d) 
es igual al producto de las probabilidades individuales P(a < X < b) y P(c < Y < d). 
En este punto se proporciona la siguiente definition: 

Definition 6.6 Sean Xy Y dos variables aleatorias con una distribution conjunta. 
Se dice que Xy Y son estadisticas independientes si y solo si, 

p(x, y) = p x (x)py(.y) si X y Y son discretas 

o bien 

fix, y) = fxtx)fy(y) si X y Y son continuas, 

para toda x y y, en donde p(.x, y) y fix , y) son las funciones bivariadas de probabili¬ 
dad y de densidad de probabilidad, respectivamente, y en donde Px(x), Pr(y),f x (x ), 
y fy( y) son las funciones de probabilidad marginal o de densidad de probabilidad 
marginal apropiadas. 
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Se desprende de esta definition que si Xy Y son estadisticamente independientes, 
la probabilidad conjunta 


b rd 


P(a<X<b,c<Y<d) = I f(x,y)dydx 


J a Jc 

= j a J fx(x)f r (y)dydx 
= j a fxWdx | f r (y)dy 

= P(a < X < b)P(c < Y < d). 


Para la misma condition, 

E(XY) 


= J J xyf(x, y)dydx 

= j xyfx(x)f r (y)dydx 

= J xf x (x)dx j yfr(y)dy 
= E(X)E(Y). 


Si X y Y son estadisticamente independientes, entonces Cov(X, Y) = p(X, Y) = 0. 
Sin embargo debe hacerse hincapie en que la proposition inversa no es tierta. Es 
decir, una covarianza igual a cero no es una condition suficiente para asegurar la in- 
dependencia entre variables aleatorias. Debe notarse que si X y Y no son estadistica¬ 
mente independientes, son estadisticamente dependientes. 

Se estableceran algunos resultados utiles con base en las definiciones 6.5 y 6.6. 
Sean Xy Y dos variables aleatorias continuas con una funcion de densidad conjunta 
de probabilidad / (x, y). 

El valor esperado de una funcion lineal de X y Y es 


E(aX + bY) = j J (ax + by) f(x, y)dydx 

- a J J a fix, y)dydx f b j J yf(x, y)dydx 

= a E(X) + b E(Y) (6.15) 

para cualquier valor de las constantes ay b. 

La varianza de una funcion lineal de X y Y es 

VariuX + bY) = E(aX + bY ) 2 - E : (aX + bY) 

= EUrX 1 + labXY + b : Y 2 ) - [uE(X) + bE(Y )] 2 
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= a 2 E(X 2 ) + 2abE(XY) + b 2 E(Y 2 ) 

- a 2 E 2 (X) - 2abE(X)E(Y) - b 2 E 2 (Y) 

= a 2 Var(X) + b 2 Var(Y) + 2abCov(X,Y). (6.16) 

Como consecuencia de los resultados anteriores, se tiene que el valor esperado de 
la suma de X y Y es la suma de los correspondientes valores esperados de X y Y, y la 
varianza de la suma de X y Y es igual a la suma de las respectivas varianzas mis 
la covarianza de X y Y. Ademis, si X y Y son estadisticamente independientes. 

Var(aX + bY) = a 2 Var(X) + b 2 Var(Y). (6.17) 

La generalization de estos resultados a n variables aleatorias se hace por induction y 
se establece en el siguiente teorema: 

Teorema 6.1 Sean X^, X 2 , ..., X n n variables aleatorias con una funcion de den- 
sidad conjunta de probabilidad f(x ,, x 2 , .... x„). Entonces 


Var 


2 a,X i 

Li=l 

n 

2 a,X, 

./= 1 


= 2 


a,E(X,) 


= 2 a 2 Var(Xi) + 22 «,« ; Cov(A',, X,) 

i=i (—i / i 


para cualquier constante a,, i = 1,2, ..., n. 


Ejemplo 6.5 Un vendedor obtiene sus ingresos mediante la venta de dos productos 
distintos. Por experiencia sabe que el volumen de ventas de A no tiene ninguna in- 
fluencia sobre el de B. Su ingreso mensual es el 10% del volumen, en dolares, del 
producto A y el 15% del volumen de B. Si en promedio las ventas del producto A 
ascienden a $10 000 con una desviacion estandar de $2 000 y las de B a $8 000 con 
una desviacion estandar de $1 000, obtengase el valor esperado y la desviacion estan¬ 
dar del ingreso mensual del vendedor. 


Sean X y Y dos variables aleatorias que representan el volumen de ventas en do¬ 
lares de los productos A y B, respectivamente. Por hipotesis: 


E{X) = 10 000, d.eAX) = 2 000: E(Y) = 8 000. d.e.(Y) = I 000. 
De esta forma se tiene 

£(0. \X + 0.15n = 0.1 E(X) + 0.15 E(Y) = $2 200, 

y 

Par(0.1* + 0.15L) = 0.01 Var(X) + 0.0225 Var(Y) = 62 500. 


La desviacion estandar es de $250. 
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6.6 Distribuciones de probabilidad condicional 

Sup6ngase que un tanque de agua contiene dos contaminantes. Sean X y Y dos varia¬ 
bles aleatorias que representan el nivel de estos contaminantes en una porcibn del tan¬ 
que que a su vez se encuentra representada por una superficie rectangular. Suponga- 
se que el nivel observado de concentracion de Y es y, pero no se observa X. Si se conoce 
la funcion de densidad conjunta de probabilidad f(x,y ), se necesita obtener una 
funcion que proporcione la probabilidad de que el nivel de concentracion de X este 
contenido en un intervalo (a, b) dado el valor observado de Y. Considere la funcion 

fix, y)/f r (y), 

en donde f Y iy) es la densidad marginal de Y. Si se mantiene constante a la variable 
aleatoria Y en el valor observado y de manera tal que f Y iv) > 0. entonces fix. y)/f r 
< v) define una funcion no negativa de X cuya integral es 1, dado que por defmicion 

[ ~T7~ dx = —[ f(x,y)dx = f Y iy)/f Y iy) = 1- 

J -~f Y (y) fr(y) J -~ 

De esta forma, fix, y)/f Y (y) es una funcion de densidad de probabilidad y la pro¬ 
babilidad de que a < X < b, dado que el nivel de concentracion de Y esy, esta 
dada por: 

P(a < X < b \ y) = f dx. (6.18) 

■>" fAy) 

Definition 6.7 Sean X y Y dos variables aleatorias con una funcion de densidad 
conjunta de probabilidad fix, y). La funcion de densidad de probabilidad condi¬ 
cional de la variable aleatoria X, denotada por fix \ y), para un valor fijoy de Y, 
esta definida por 


fix | y) = fix, y)/f Y iy), 

en donde f Y iy) es la funcion de densidad de probabilidad de Y de manera tal que 

My) > 0. 

De manera analoga, la funcion de densidad de probabilidad condicional de Y 
para un valor fijo x de X se define como 

/( y | x) = fix, y)/f\ix) f x ix) > 0, (6.19) 

en donde fxix) es la densidad marginal de X. Puede pensarse a fix | y) como una 
funcion que da la densidad de probabilidad a lo largo de una linea horizontal en el 
piano ( jc , y) correspondiente a un valor fijo y de Y. De manera similar, fix \ x) es 
una funcion que da la densidad de probabilidad a lo largo de una linea vertical en el 
piano (x, y) correspondiente a un valor x de X. 
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Notese que si la densidad conditional /(x \ y ) por ejemplo, no contiene a y, en- 
tonces X es estadisticamente independiente de Y. Esto es, si X y Y son estadistica- 
mente independientes, entonces 

/( x,y) = f x (x)f Y (y) 

y 

f(x\y) = f(x,y)/f r (y) 

= fx(x)fAy)/f r (y) 

= fx(x). 


De manera similar, si 


fix, y) = fx(x)My), 


entonces 

f(y\x) = f x (x)fy( y)/fx(x) 

— fAy)- 


Los valores esperados condicionales se definen de manera analoga a la seflalada 
en la definition 6.5. Por ejemplo, los valores esperados condicionales de X puesto 
que Y - y, y de Y, ya que X - x, se definen como 

E(X | y) = J xf(x | y)dx 

y (6.20) 

E(Y\x) = j , yf (y \x)dy. 


respectivamente. El valor esperado de X dado y es una funcion del punto fijo y y re- 
presenta la media de X a lo largo de la linea correspondiente a y. Por simetria, el va¬ 
lor esperado conditional de Y dado x es una funcion de x y representa la media de Y 
a lo largo de la linea correspondiente a x. De manera similar, 


y 

en donde 


y 


Var(X | y) = E(X 2 1 y) - E : (X \ y) 


( 6 . 21 ) 


Var( Y j x) = E(Y 2 \ x) - E 2 (Y\x). 


E(X 2 1 y) = J x~f(x | y)dx 
E(Y 2 \x) = f y 2 f(y\x)dy. 
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Ejemplo 6.6 Sean Xy Y los niveles de concentration en ppm de dos contaminantes 
en una determinada portion de un tanque de agua. Si la funcion de densidad conjun- 
ta de probabilidad esta dada por 


fix.y) = 


\(x + y)/8000 0 < x, y < 20, 

0 para cualquier otro valor, 


y si el nivel de concentration observado de Y es de 10 ppm, obtener la probabilidad 
de que el nivel de concentration de X sea, a lo mas, 14 ppm. Obtener la media y la 
varianza conditional de X para Y = 10 ppm. 


Dado que 


se tiene 


f(x, y) = (x + y)/8000 0 < x, y < 20, 


M y) = ^ l (x + y)dx = (y + 10)/400, 

y la densidad de probabilidad conditional de X es 

f(x\y) = (x + y)/20(y + 10), 

la que se reduce a 

f(x\Y = 10) = (x + 10)/400 
para Y = 10. Por lo tanto. 


P(X ^ 14 I Y = 10) 


= />l- 

-if 


10 )dx 


400. 

= 0.595. 


(x + 10 )dx 


Para la media y varianza condicional de X en Y = 10 se tiene 

f 20 

E(X\Y = 10) = xf(x Y = \0)dx 
Jo 


= _l r 

400 Jo 
= 11.67; 

f20 


(jc 2 + 10 x)dx 


rlO 

E(X Z | Y = 10) = x 2 f(x\ Y = 10 )dx 
Jo 
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.±r 

400 Jo 


400 
= 166.67; 
Var(X I r = 10) = 30.56. 


(jc 3 + I0x 2 )dx 


6.7 Analisis bayesiano: las distribuciones a priori y a posteriori 

Se establecio en la seccion 2.8 el teorema de Bayes para probabilidades condicionales 
de eventos discretos. En este contexto se examinar£ de manera breve como emplear- 
lo para modificar el grado de creencia con respecto a los resultados de un fenomeno 
al tenerse nueva informacion de este. Sin embargo, es mas importante la representa¬ 
tion que proporciona el teorema de Bayes para la distribucion condicional de una 
variable aleatoria ya sea esta cotinua o discreta. Tal representation es importante de- 
bido a que, como se vera en el capitulo 8, proporciona el mecanismo necesario sobre 
el cual se basa la inferencia bayesiana. En esta seccion se examinaran los conceptos 
de distribucion a priori y distribucion a posteriori y se volvera a plantear el teorema de 
Bayes con estos conceptos. 

Sea Y una variable aleatoria (discreta o continua) definida de manera tal que sus 
valores representan las posibles opciones en que puede ocurrir un fenomeno aleato- 
rio antes de llevar a cabo un experimento. El grado de creencia del investigador con 
respecto a estas posibilidades se encuentra expresado por una funcion de probabili¬ 
dad Pr(y). que recibe el nombre de funcion de probabilidad a priori de Y, si Y es 
discreta, o una funcion de densidad /Y(y), denominada funcion de densidad de pro¬ 
babilidad a priori de Y, si Y es continua. La especificacion de la forma de p Y (y) o 
/>■(y) depende de la conviccion del investigador con respecto a los valores de Y antes 
de que la informacion muestral se encuentre disponible. Esta conviccion se puede 
basar en cualquier tipo de informacion que se encuentre disponible, incluyendo el 
juicio subjetivo. Sea fix | y) la funcion de densidad de probabilidad condicional de 
cualquier variable aleatoria X*, la cual representa evidencia muestral en funcibn 
de una alternativa fijay de Y. La funcion fix | y) recibe el nombre de funcion de 
verosimilitud debido a que representa el grado de concordancia del resultado 
muestral x, dado el valor y de Y. 

Cuando la informacion a priori con respecto a los valores de Y se combina con la 
informacion que proporciono la muestra, el resultado es un conjunto de informacion 
modificada con respecto a la variable aleatoria Y. En otras palabras, la combination 
de la distribucion a priori y de la funcion de verosimilitud origina una distribucion 
condicional para Y, dado el resultado muestral, que se conoce como la distribucion a 
posteriori de Y. Esta combinacion se hace de acuerdo con el teorema de Bayes, mismo 
que se replantea de la siguiente forma: 

Teorema 6.2 Sea p Y iy) o f Y iy) la funcion de probabilidad o de densidad de pro¬ 
babilidad a priori de Y, respectivamente, y sea fix | y) la funcion de verosimilitud. 

* Se supone que la variable aleatoria X es continua aunque tambien puede ser discreta. 
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Entonces la probabilidad a posteriori o funcion de densidad de probabilidad a poste- 


si Y es discreta, (6.23) 


si Y es continua. (6.24) 


La funcion de probabilidad a posteriori piy \ x) o la funcion de densidad de 
probabilidad a posteriori f(y | jc) reflejan el grado de creencia modificado del inves- 
tigador con respecto a la variable aleatoria Y despues de obtener information mues- 
tral. Dado que esta informacion se puede verificar de manera periodica, puede 
auoptarse facilmente un punto de vista secuencial. En este contexto, la distribucion 
a posteriori actual puede convertirse, en un futuro, en una distribucion a priori 
cuando sea necesario llevar a cabo otra revision con respecto a la variable aleatoria. 
La revision periodica de las probabilidades se hace posible mediante el empleo suce- 
sivo del teorema 6.2. 

Es interesante notar que el denominador de (6.23) o (6.24) es la funcion de densi¬ 
dad de probabilidad marginal o no condicional de X; esto es, 

fx(x) = 'Zf(x\y)p r (y) (6.25) 

Y 

O 

fx(x) = \j\x\y)fy{y)dy, (6.26) 

dependiendo de cuando Y es discreta o continua, respectivamente. Ademas, el nu- 
merador de (6.23) o (6.24) es el producto de la funcion de verosimilitud y la funcion 
de probabilidad a priori y, de esta manera, es la probabilidad conjunta de X y Y 
expresada como 


riori de Y dada la evidencia muestral x, es 

fix | y)p r iy) 


p(y\x) = 


fiy I x) = 


'Zf(x\y)pAy) 

Y 

fix I y)fr(y) 

I fix I y)friy)dy 


fix. y: 

> = fix | y)py(y) 

si Y es discreta. 

(6.27) 

fix. y 

) = fix | y)/,(y) 

si Y es continua. 

(6.28) 


Notese que para (6.27) la funcion fix, y) es una mezcla bivariada de una variable 
aleatoria continua y otra discreta. 

Ejemplo 6.7 Un vendedor de articulos domesticos nota que el numero de personas 
que compran determinada marca de televisores varia aleatoriamente en el tiempo. El 
vendedor concluye que esta proporcion es una variable aleatoria discreta que puede 
tomar los valores de 0.3, 0.35, 0.4 y 0.45, dependiendo de diversas consideraciones 
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de tipo economico. Con base en information previa, les asigna las probabilidades a \ 
priori 0.4, 0.3, 0.2 y 0.1, respectivamente. Una muestra de tamaflo n = 15 revela ; 

que ocho de los televisores que se venden son de la marca de interes. Si se supone que > 

para una proportion en particular p, el numero de televisores de la marca que se 
vende para una muestra fija n es una variable aleatoria binomial, obtener las proba¬ 
bilidades a posteriori. 

Sea X la variable aleatoria que representa el numero de aparatos de la marca de 
interes que se venden de una muestra de tamaflo n. El valor X = 8 para n = 15, 
representa la evidencia muestral condicionada sobre una proportion en particular p 
de preferencia del consumidor para esta marca. Por hipotesis X es binomial y su 
funcion de verosimilitud es 

pU\ 15 | p) = ■■ * 5! u p'{ 1 - p) l5 -\ jc = 0, 1, 2.15. 

(15 - .v)!jc! 

Si p = 0.3, el valor de verosimilitud de la muestra es 

PiX = 8 | p = 0.3) = p( 8; 15 | 0.3) = (0.3> 8 (0.7) 15 - 8 = 0.0348. 

Para los demas valores de p se tiene 

P(X = 8 | p = 0.35) = 0.071, 

P(X = 8 | p = 0.4) = 0.1181, 

P(X = 8 | p = 0.45) = 0.1647. 

Notese que las dos variables aleatorias son discretas. A pesar de lo anterior, 
puede emplearse el teorema de Bayes (6.23) para obtener las probabilidades a poste¬ 
riori. La tabla 6.1 proporciona los detalles computacionales. La suma de las proba¬ 
bilidades tanto a priori como a posteriori debe ser igual a uno, dado que cada una de 
estas es una distribution de probabilidad. En la figura 6.2 se ilustran las graficas 


TABLA 6.1 Determination de las probabilidades a posteriori para el ejemplo 6.7 


Valores de la 
proporcion 

Probabilidad 
a priori 

Verosimilitud 
de la muestra 

Probabilidad 
a priori 

X 

verosimilitud 

Probabilidad 
a posteriori 


0.3 

0.4 

0.0348 

0.01392 

0.01392/0.07531 = 

0.1848 

0.35 

0.3 

0.071 

0.02130 

0.02130/0.07531 = 

0.2828 

0.4 

0.2 

0.1181 

0.02362 

0.02362/0.07531 = 

0.3137 

0.45 

0.1 

0.1647 

0.01647 

0.01647/0.07531 = 

0.2187 

Totales 

1.0 


0.07531 


1.0000 


www. FreeLibros. com 





0. / /Anal is is oayesmno; ius uisiriuuc tunes u pi tun y u pusteuun wj 




FIGURA 6.2 rrolabilidades a priori y a posteriori para el ejemplo 6.7 


de ambas distribuciones de probabilidad, las que muestran un desarrollo notable en 
las probabilidades para los cuatro valores posibles de p. Tambien existe un de¬ 
sarrollo en los valores esperados de la preferencia del consumidor para esta marca. 
El valor esperado a priori es 0.35 y el valor esperado a posteriori es 0.3783. 

Se menciono en la seccibn 4.5 que la distribution binomial negativa es una altemati- 
va adecuada del modelo de Poisson cuando la frecuencia de ocurrencia no es constante 
sobre el tiempo o el espacio. Por ejemplo, en las estadisdcas de accidentes es poco pro¬ 
bable que la frecuencia con que estos se presentan entre grupos distintos sea constante 
e independiente sobre un lapso fijo. Lo anterior tiene como consecuencia que el 
punto de vista bayesiano sea una forma de analisis de estos datos mucho mas apro- 
piada. 

Supongase que todas las posibles frecuencias de ocurrencia pueden considerarse 
como valores de una variable aleatoria continua A, cuya distribution a priori es una 
distribution gama con una funcion de densidad dada por 

/(A; k. 6) = — I—: X*~'exp(-X/0), X > 0. (6.29) 

1 (A. 

Sea X una variable aleatoria que representa el numero de accidentes que se observan 
en un grupo especifico. Entonces puede argumentarse que X es una variable aleato¬ 
ria de Poisson que depende de una X especifica de A, con una funcion de verosimili- 
tud dada por 

p(x | X) = X r exp(- X)/.r! x - 0, 1,2, ... . (6.30) 

Antes de obtener la distribution a posteriori de A, se demostrara que la funcion de 
probabilidad marginal de X es la binomial negativa. Esto es, si para cada valor X 
de A, X tiene una distribution de Poisson, entonces la distribution no conditional de 
X sobre todos los posibles valores de X es la binomial negativa. 


www. FreeLibros. com 













204 Distribuciones conjuntas de probabilidad 


De (6.26) se desprende que la funcion de probabilidad marginal de X es: 


p(x | k)f A (\)dk. 


(6.31) 


Notese que el integrando de (6.31) es la funcion de densidad conjunta de probabili¬ 
dad de X y A, lo que da como resultado una mezcla bivariada de una variable aleato- 
ria discreta con una continua. 

La sustitucion de (6.29) y (6.30) en (6.31) conduce a: 

= <m2) 

En el integrando de (6.32) sea u = X [(0 + I )/0]; de esta forma X = 10/(0 + 1) 
]it y d\ - [0/(9 + 1 )]du. Entonces 


PxM = Yik)i k L 6/(6 + 

= 0/(0 + ir + *rct + k) 

xT(k)0 k 

n.v + k) I 1 Vf 6 V X = 0,1,2. 

x\r(k) \0 + 1 ) \9 + l) ' k,e> 0 . 


(6.33) 


La expresion (6.33) es identica a la dada por (4.35), que es la funcion de proba¬ 
bilidad de la distribucion binomial negativa para k > 0. Notese que en (6.33), 
p = \/(0 + 1) y 1 - p = 0/(0 + 1), de forma tal que 0 < p < 1 dado 
que 9 > 0. Ademas, de (4.39) la media de X es 


E(X) = 


k9/(9 + 1) 
1 /(9 + I) 


k0 = E( A). 


De esta manera, la distribucion binomial negativa es una combination de distribu¬ 
ciones de Poisson donde la frecuencia aleatoria de ocurrencia tiene una distribucion 
gama cuya media es igual a la media de Poisson. Por esta razon la distribucion bino¬ 
mial negativa tambien se conoce como una distribucion compuesta de Poisson. 

Mediante el empleo del teorema 6.2 y, en particular, de la expresion (6.24), se 
puede obtener la densidad de probabilidad a posteriori de A condicionada al resul¬ 
tado muestral .v de la siguiente forma: 

, A i+ * -| exp {-[(0 + i)/0]x} /n.v + k)( i VY 0 y 

/(X|.<) ---/ -^T UtfJ 

__ X' 'exp{ - [(0 + l)/0]\} lUMg + I) 1 ’* 

T( A ).v! 0 A n.r + k)0' 


{(0 + l)/0] , ^X t + A 'exp{-[(0 j- 1 )/0]X} 
H.v + k) 


X > 0. 


(6.34) 
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La comparacion de (6.34) con la funcion de densidad de probabilidad de la distribu¬ 
tion gama, dada por (5.45), muestra que la distribution a posteriori de A es una dis¬ 
tribution gama con parametros de forma Jr + k ydeescala 0/(0 + 1). Debenotar- 
se que si las distribuciones a priori y a posteriori pertenecen a la misma familia de 
distribuciones, como en el presente caso, esta retibe el nombre de familia conjugada 
con respecto a la distribution de la muestra de datos. En este caso, la familia gama 
se conjuga con respecto a la distribution de Poisson. 

Ejemplo 6.8 Supongase que para las estadisticas de accidentes se decide asignar a 
la frecuencia de ocurrencia una distribution a priori gama con parametro de forma 
dos y de escala tres. Supongase que posteriormente se observan dos accidentes para 
una frecuencia en particular. Obtener la funcion de densidad a posteriori de la fre¬ 
cuencia, dado el resultado muestral, y compararla con la densidad a priori. 


Sea A la frecuencia de ocurrencia. De (5.45) la densidad a priori de A es 

2, 3) = ^Xexp( - A/3), X > 0. 

Dado un resultado muestral X = 2, la densidad a posteriori de A que se obtiene de 
(6.34) es 


/(X; 4, 3/4 | .v) 


^(4/3)Vexp( 



X > 0. 


En la figura 6.3 se proporciona una comparacion entre las funciones de densidad a 
priori y a posteriori. De esta es evidente que la densidad a posteriori se encuentra 
menos asimetrica que la densidad a priori. Notese que la frecuencia media a priori es 
seis mientras que esta misma a posteriori es tres. 

En la section 5.4 se menciono que la distribution beta tiene un papel muy impor- 
tante en la estadistica bayesiana. Para ilustrar lo anterior considerese de nuevo el 
analisis bayesiano del pararametro de proportion de la distribution binomial. 


Ejemplo 6.9 En un proceso de manufactura, el interes se centra alrededor de la 
proportion de articulos defectuosos. Dado que es poco probable que el proceso 
tenga cambios menores en un lapso determinado como distintos desarrollos, va- 
riaciones en la materia prima y otros que pueden influir en la proportion de articulos 
defectuosos, es razonable pensar la proportion de estos como una variable aleatoria 
cuyos posibles valores se encuentran en el intervalo (0,1). Para una proportion dada 
de articulos defectuosos p, se sabe que el numero x de estos que se observa en una 
muestra aleatoria fija de n articulos es binomial. Esto es, la funcion de probabilidad 
condicional de X para n fijo, dado p , es 

P(x: n | p) = - - - p'( 1 - />)" \ .v = 0. 1,2, ... n. 

(/; - v)!.i! 
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FIGURA 6.3 Densidades a priori y a posteriori para el ejemplo 6.8 


Si la distribution a priori de la proportion de articulos defectuosos es una distribu¬ 
tion beta con una funcion de densidad de probabilidad 

Mpict'P) = P a ~'( 1 ~ Pf~' 0^p^\, (6.35) 

H«) I (/3) 

demostrar que la distribution a posteriori de la proportion de articulos defectuosos, 
dado el numero x de estos, tambien es una distribution beta. 


De (6.24) la densidad de probabilidad a posteriori de la proportion de articulos 
defectuosos es: 


ftp I x) = 


p(x: n [ p)Mp : «■ /3) 
J p(x\ n \p)f r (p: o. 


— p'(1 — p)“ 


(n - ,v)!.r! 


Ha) r '(fi) 


P(a + ( 1 ) 


(n- .v)!.v! Ha) V(fi) Jn 
p ' + " '(I - p)"^ - ' ' 


'(I - pT^-'-'dp 


P' ‘“‘'(I - P) 


- I 


dp 


www. FreeLibros. com 



6.8 La distribution normal bivariada 207 


perode (5.33), la integral - p)"^ xi dp = B(x + a. n+p-x). Porlo 

tan to, la densidad a posteriori es: 


rV* + a ~ • 


ftP f ft = 


(1 - P)‘ 


n+li-x- I 


B(x + a, n + (3 - x) 

T(n + a + p) 

TCc + a) T(n + p — x) 


'(1 - p) 


+ (i -X- l 


O^p^l. (6.36) 


que es una densidad beta con parametros (x + a) y (n + P - x). Por lo tanto, la 
familia conjugada para la distribucion binomial es la familia de distribuciones beta. 


6.8 La distribucion normal bivariada 

En el capltulo cinco se estudio la distribucion normal de una variable aleatoria. El 
concepto de distribucion normal puede extenderse para incluir variables alea- 
torias. En particular, la distribucidn normal bivariada se emplea de manera extensa 
para describir el comportamiento probabilistico de dos variables aleatorias. 

Definition 6.8 Se dice que las variables aleatorias X y Y tienen una distribucion 
normal bivariada si su funcion de densidad conjunta de probabilidad esta dada por 


ftx, y) 


2-rr a x cr y \/l - p : 2(1 - p') 


x - P- X 


(6.37) 


2p 


(T X \ <Ty 


X - Px\ V - fly\ V - fJLy 


(Ty 


■x < x, y < x . 


en donde 


p x = E(X), p Y ~ E(Y), or\ = Var(X), cr; = Var(Y), 


y p es el coeficiente de correlation de X y Y, definido en la section 6.4. 

La figura 6.4 ilustra la funcion de densidad normal bivariada que es una superfi- 
cie tridimensional con forma de campana. Cualquier corte a traves de la superficie 
da origen a una curva de forma normal univariada, mientras que pianos paralelos al 
piano xy interceptan la superficie en elipses que reciben el nombre de contornos de 
probabilidad constante. 

Es interesante notar que, a pesar de que p = 0 es una condition necesaria de in¬ 
dependence, para la distribucion normal bivariada tambien es una condition sufi- 
ciente. Eso es, si p = 0, entonces 


ftx. v) = - 


iT(r x cr t 


exp 


■v ~ M.x 
cr \ 


[I>' ~ P-i 
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FIGURA6.4 Densidad normal bivariada con E(X ) = E(Y) = 0, Var(X) = Var(Y) = 1, 
yp = 0 


—=—exp - (x - /j. x y/2a\ 

V 2tt cr.v L 


=—exp -(v - ii y ) 2 /2cr\ 

In (Ty L 


= /v(-'f)/>(y), 

en donde f v (x) y f y (v) son las densidades normales univariadas de X y Y, respecti- 
vamente. 

Se puede demostrar que, mediante el empleo de (6.37) e integrando con respecto 
a y, la densidad marginal de X es normal con media Ma varianza (r 2 x . De manera si¬ 
milar, la densidad marginal de Y es normal con media y varianza a]. Por la de¬ 
finition 6.7, la densidad de probabilidad conditional de X dado el valor y de Y es 
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Se puede obtener una expresion similar para la densidad conditional de Y dado el 
valor x de X. 

Ejemplo 6.10 Sean X y Y las desviaciones horizontal y vertical (sobre un piano), 
respectivamente, de un vehiculo espacial tripulado con respecto al punto de aterriza- 
je de este en el mar de la Tranquilidad. Supongase que X y Y son dos variables alea- 
torias, independientes cada una, con una distribution normal bivariada y medias 
f^x — pty = 0 y varianzas iguales. i,Cual es la maxima desviacion estandar permi- 
sible de Xy Y, que cumplira con el requisito de la NASA de tener una probabilidad 
de 0.99, de que el vehiculo aterrice a no mas de 500 ft del punto elegido, tanto en di¬ 
rection vertical como horizontal? 


Debido a la independencia y a la hipotesis de que cr x = a y = a, la probabili¬ 
dad conjunta es 

P{ - 500 < X < 500, -500 < Y< 500)= P(~500 <X < 500) 

• P( - 500 < Y < 500) 

500 „ 500\ 

PI-<^< — 

(T (T 


500 500 

— < z < — 

CT <T 


a cr 


Puesto que por hipotesis es 


„ 500 500\ 

P -1- ~<Z< — I = 0.99, 

(j a 


500 ,, 500 

P|-<Z< — 

<T <T 


= 0.99499 


o 


pero 




0.0025, 


P(Z > 2.81) = 0.0025: 


por lo tanto 500/cr = 2.81, y <x v = a ) =£ 177.94 pies 
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Ejercicios 

6.1. Se seleccionaron, aleatoriamente, 60 personas y se les pregunto su preferencia con res- 
pectoa tres marcas A, By C. Estas fueron de 27, 18 y 15 respectivamente. iQue tan pro¬ 
bable es este resultado si no existen otras marcas en el mercado y la preferencia se com- 
parte por igual entre las tres? 

6.2. Supongase que de un proceso de production se seleccionan, de manera aleatoria, 25 
articulos. Este pi oceso de produccion por lo general produce un 90% de articulos listos 
para venderse y un 7% reprocesables. ^Cual es la probabilidad de que 22 de los 25 
articulos esten listos para venderse y que dos sean reprocesables? 

6.3. Sean X y Y dos variables aleatorias continuas con una funcion de densidad conjunta de 
probabilidad dada por: 


/(.v. y) = 


(3.r — v)/5 1 < x < 2, I < y < 3. 

0 para cualquier otro valor. 


a) Obtener la funcion de distribution conjunta acumulativa. 

b) iCual es la probabilidad conjunta de que X < 3/2 y Y < 2? 

c) Mediante el empleo de sus respuestas a la parte a, obtener las distribuciones acumula- 
tivas marginales de X y Y. 

d) Obtener las funciones de densidad marginal de X y de Y. 

6.4. Sean Xy Y dos variables aleatorias continuas con una funcion de densidad conjunta de 
probabilidad dada por 


/(.v, y) 


.vexpf— jc( v + D] 
0 


.v, v > 0, 

para cualquier otro valor. 


a) Demostrar que fix. y) es una funcion de densidad conjunta de probabilidad. 

b) iCual es la probabilidad conjunta de que X < 2 y Y < I ? 

c) Obtener las funciones de densidad marginal de X y de Y. 

d) iSon X y Y estadisticamente independientes? 

6.5. Sean X y Y dos variables aleatorias discretas en donde los posibles valores que estas 
pueden tomar son - 1, 0. y 1 . En la siguiente tabla se dan las probabilidades conjuntas 
para todos los posibles valores de X y Y. 



- 1 

.Y 

() 

1 

- 1 

1/16 

3/16 

1/16 

Y 0 

3/16 

0 

3/16 

1 

1/16 

3/16 

1/16 
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a) Obtener las funciones de probabilidad marginal p x W y p r (y). 

b) iLas variables aleatorias X y Y son estadisticamente independientes? 

c) Obtener Cov{X, Y). 

6.6. Para la funcion de densidad conjunta de probabilidad del ejercicio 6.3, obtener Cov(X, 
Y) y p(X, Y). 


6.7. En funcibn de su prioridad, un programa para computadora espera en la fila de entrada 
cierto tiempo, depues del cual lo ejecuta el procesador central en un lapso dado. La fun¬ 
cion de densidad conjunta para los tiempos de espera y ejecucion se determina por 


fit,, h) = 




Dada la distribution conjunta acumulativa: 


lt 2 > 0, 


para cualquier otro valor. 


f[I - exp(-/,/5)][l — exp( — 10/01 /,./■»> 0. 

10 para cualquier otro valor. 


a) Obtener la probabilidad conjunta de que el tiempo de espera no sea mayor de ocho 
minutos y el de ejecucion no sea mayor de 12 segundos. 

b) Obtener las funciones de densidad marginal y deducir que estos lapsos son variables 
aleatorias independientes. 


6.8. Las variables aleatorias X y Y representan las proporciones de los mercados correspon- 
dientes a dos productos distintos fabricados por la misma compaflia y cuya funcion de 
densidad conjunta de probabilidad esta dada por 

f (,v + v) 0 =£ ,r, v S- 1, 

fix. v) = j 

10 para cualquier otro valor. 


a) Obtener las funciones de densidad marginal de X y Y. 

b) t,Las variables aleatorias X y Y son estadisticamente independientes? 

c) Si X = 0.2, obtener la funcion de densidad de probabilidad condicional de Y. 

6.9. Las variables aleatorias Xy Y representan el largo y ancho (en cm) de una hoja de acero. 
Si X y Y son independientes con funciones de densidad de probabilidad dadas por 

1, 49 < y < 50. 

0 para cualquier otro valor. 

usese la definicion de la varianza para obtener la varianza del area de la hoja de acero 
XY. 

6.10. Sea X una variable aleatoria continua y Y discreta. 

a) Si fix. y) = .r v exp( — 2.v)/y!. x > 0. y = 0, 1,2. obtener la funcion de 

probabilidad marginal de Y. 

b) Obtener la funcion de probabilidad condicional de X para Y = 2. 

c) Obtener E{X \ 2) y Var(X | 2). 

6.11. Sean X y Y dos variables aleatorias. Demostrar que VariaX - bY ) = o' VariX) + b~ 
Vari Y) - 2 oh CoiiX. 1'), en donde ay b son constantes. 


fx(x) = 


99 < ,r < 100. 

/.(v) = 

para cualquier otro valor. 
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6.12. Sean X y Y dos variables aleatorias. Demostrar que CoviaX, bY) = ah CoviX. K), en 
donde a y b son constantes. 

6.13. Si X y Eson dos variables aleatorias independientes VariX + Y) - Var(X - Y) = 
Var{X) + Var{Y). Comparar este resultado con VariX + K) cuando VariX - Y) 
CoviX, Y) > 0 o Cov(X, Y) < 0. iQue puede concluirse? 

6.14. Supongase que la frecuencia A a la que ocurren accidentes automovilisticos en un lapso 
fijo es una variable aleatoria con una ditribucion gama y parametros de forma y escala 
igual a dos. Si para cada valor A de A la distribucion eondicional del numero de acciden¬ 
tes es una distribucion de Poisson, obtener la funcion de probabilidad marginal de X y 
calcular las probabilidades para X = 0, 1, 2 ... 10. iComo son estas probabilidades al 
compararlas con las que se obtienen bajo la suposicion de una frecuencia constante 
A - 4? 

6.15. Supongase que la incidencia de cancer pulmonar para un determinado numero de perso¬ 
nas adultas, sin importar sus habitos de fumador, su edad, etc., es una variable aleatoria 
con distribucion gama con parametros de forma y escala iguales a dos. Para un grupo es- 
pecifico de personas, el numero que presentaran cancer pulmonar es una variable alea¬ 
toria de Poisson en donde el valor del parametro de esta depende de la incidencia de 
cancer en este grupo. Obtener la probabilidad no eondicional de que no mas de dos per¬ 
sonas desarrollen cancer en este grupo. 

6.16 En el ejercicio 6.15 supongase que x = 5 adultos, de cierto numero, desarrollaran can¬ 
cer. Obtener la densidad a posteriori de A dado x, calcular las medias y varianzas tanto 
a priori como a posteriori y comparar los resultados. 

6.17 Supongase que el gerente de una planta descubre que la proporcion de articulos defec- 
tuosos en su proceso de produccion no es constante sino que se comporta como una va¬ 
riable aleatoria. Sin ninguna evidencia, decide asignar una distribucion beta con a = 1 
y 0 = 24 para la produccion de articulos defectuosos. 

a) Graficar la funcion de densidad a priori y obtener su media y su varianza. 

b) Supongase que el gerente toma una muestra n = 12 articulos y encuentra uno de- 
fectuoso. Bajo las hipotesis necesarias, obtener y graficar la funcion de densidad de 
probabilidad a posteriori. 

c) Encontrar la media y la varianza a posteriori y compararlas con la media y la varian¬ 
za a priori. 

d) Hagase uso del ejercicio 5.24 para obtener la probabilidad a posteriori de que la pro¬ 
porcion de articulos defectuosos sea a lo mas 0.05. 

6.18. Supongase que la proporcion de lanzamientos exitosos de satelites de comunicaciones es 
una variable aleatoria con distribucion beta y parametros a = 21 y fi = I. Side los ul- 
timos 12 lanzamientos uno ha fracasado, obtener la funcion de probabilidad a poste¬ 
riori de la proporcion de lanzamientos exitosos y calcular la probabilidad a posteriori 
para que la proporcion de estos sea mayor de 0.95. Emplee la expresion 5.44. 

6.19. La funcion de densidad conjunta de probabilidad para la demanda mensual de dos pro¬ 
duces es una distribucion normal bivariada dada por 


fix. y) 


1 

-7= exp 

I00uV-3 
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a) iCual es el coeficiente de correlacion entre X y Y! 

b) iCual es la covarianza entre X y Yl 

c) Obtener la funcion de densidad de probabilidad condicional f(x | y). 

d) Supongase que la demanda de Y es 30. iCual es la probabilidad condicional de que 
X sea menor que 65? 

6.20. Supongase que el C1(A") y la calificacion promedio de estudiantes no graduados de li- 
cenciatura Y son variables aleatorias que se encuentran distribuidas de manera conjunta 
como una distribution normal bivariada fi x = 100, cr x = 10. /i, = 3, cr K = 0.3, y 
Cov(X,Y) = 2.25. 

a) Si algun estudiante posee un Cl de 120, icuales son los valores de la media y la des- 
viacion estandar condicionales para y? 

b) Dado que el Cl es 120, obtener la probabilidad de que Y sea mayor de 3.5. 

c) Supongase que la calificacion promedio de un estudiante es 2.8. iCual es la probabi¬ 
lidad de que esta persona tenga un Cl mayor de 115? 
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CAPITULO SIETE 

Muestras aleatorias 

i 

y distribuciones de muestreo 


7.1 Introduction 

En el capitulo uno se menciono que para comprender la esencia de la inferencia esta¬ 
distica es necesario comprender la naturaleza de una poblacion y de una muestra. 
Una poblacion representa el “estado de la naturaleza” o la forma de las cosas con 
respecto a un fenomeno aleatorio en particular, mismo que puede identificarse a tra- 
ves de, una caracteristica medible X. La manera en que ocurren las cosas en relacion 
con X puede definirse por un modelo de probabilidad que recibe el nombre de distri- 
bucion de probabilidad de la poblacion, Por otro lado, una muestra es una coleccion 
de datos que se obdenen al llevar a cabo repeddos ensayos de un experimento para 
lograr una evidencia representativa acerca de la poblacion en relacion con la caracte¬ 
ristica X. Si la manera de obtener la muestra es imparcial y tecnicamente buena, en- 
tonces la muestra puede contener informacidn util con respecto al estado de la natu¬ 
raleza y a partir de ello se podr&n formular inferencias. Ahora bien, estas ultimas 
son inductivas y, por lo tanto, est&n sujetas a riesgo, dado que representan un razo- 
namiento que va de lo particular a lo general. 

Ert los capitulos cuatro, cinco y seis se examinaron con detalle algunas distribu¬ 
ciones de probabilidad que pueden servir como modelo para la distribution de una 
poblacion de interes. En los capitulos restantes el principal objetivo es examinar dis- 
tintas tecnicas por medio de las cuales puede aplicarse el proceso inductivo de la in¬ 
ferencia estadistica para proporcionar resultados utiles y confiables. La inferencia 
estadistica se define como la coleccion de tecnicas que permiten formular inferencias 
inductivas y que proporcionan una medida del riesgo de estas. En este capitulo se es- 
tableceran algunos conceptos teoricos basicos con respecto al muestreo y a la infe¬ 
rencia estadistica. La aplicacion de estos conceptos se dara con gran detalle en 
capitulos posteriores. 


7.2 Muestras aleatorias 

Como la inferencia estadistica se formula con base en una muestra de objetos de la 
poblacion de interes, el proceso por medio del cual se obtiene sera aquel que asegure 
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la selection de una buena muestra. En el capltulo uno se expuso que una manera de 
obtener una buena muestra resulta cuando el proceso de muestreo proportiona, a cada 
objeto en la poblacibn, una oportunidad igual e independiente de ser incluido en la 
muestra. Si la poblacibn consiste de N objetos y de fcstos se selecciona una muestra de 
tamaiio n, el proceso de muestreo debe asegurar que cada muestra de tamafio n tenga 
la misma probabilidad de ser seleccionada. Este procedimiento conduce a lo que co- 
munmente se conoce como una muestra aleatoria simple. En este contexto, la pa- 
labra “aleatorio” sugiere una total imparcialidad en la selection de la muestra. 

La naturaleza de la inferencia inductiva demanda una muestra aleatoria porque 
la seleccibn de esta se lleva a cabo con el fin de proporcionar los medios adecuados 
para que pueda formularse una inferencia con respecto a alguna caracteristica de la 
poblacibn de interes. Por ejemplo, pueden formularse inferencias de ciertas condi- 
ciones que se suponen validas para la poblacibn si la muestra que se observd se 
encuentra o no dentro de la variacibn muestral, misma que prevalecerb si las condi- 
ciones son verdaderas. De esta forma la calidad d p la aleatoriedad en una muestra 
asegura la aplicacibn correcta de la probabilidad para evaluar el riesgo inherente en 
un proceso inductivo. 

En este momento es importante estructurar el concepto de una muestra aleato¬ 
ria simple empleando para ello los conceptos de probabilidad que se presentaron en 
los capitulos dos al seis. Para llevar a cabo lo anterior, primero se examinaran si- 
tuaciones que se presentan, de manera frecuente, en los muestreos. La primera de es- 
tas surge en muchos experimentos que involucran fenomenos aleatorios en la inge- 
nieria y las ciencias fisicas. En estos casos la poblacion de interes no consiste en obje¬ 
tos tangibles a partir de los cuales se selecciona un cierto numero para formar la 
muestra. Mas bien, la poblacibn se considera constituida por un numero infinito de 
posibles resultados para alguna caracteristica medible de interes. Esta caracteristica 
generalmente es una medicion fisica como el nivel de concentracibn de un contami- 
nante, la demanda de un producto o el tiempo de espera en un servicio. Sea X una 
caracteristica medible y f{x\ 8) la funcion de densidad de probabilidad de la distri- 
bucibn de la poblacibn. El siguiente procedimiento es una forma de muestreo para 
este dpo de poblacibn: 

1. Se disefia un experimento y se lleva a cabo para proporcionar la observacibn X y 
de la caracteristica medible X. El experimento se repite bajo las mismas condi- 
ciones proporcionando el valor X 2 . El proceso se continua hasta tener n observacio- 
nes X v X 2 , ..., X n de la caracteristica X. 

En este procedimiento de muestreo, las observaciones muestrales se colectan a 
traves de ensayos independientes que ocurren cada vez que el experimento se repite 
bajo condiciones identicas para todos los factores que son controlables. En este con¬ 
texto, cada observacibn del /-esimo experimento se considera como una selection de 
la misma fuente que proporciona la observacibn de cualquier otro ensayo para X. 
En esencia, las observaciones bajo las mismas condiciones como resultado de repeti- 
dos ensayos independientes de un experimento, constituye lo que se denomina un 
muestreo aleatorio con reemplazo. De acuerdo con lo anterior, cada una de las ob¬ 
servaciones X u X 2 . X„ es una variable aleatoria cuya distribucion de probabi¬ 

lidad es identica a la de la poblacibn. 
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Una situation diferente se presenta cuando se lleva a cabo una selection de ob- 
jetos tangibles de una poblacion que consiste en un numero finito de objetos (seres 
humanos, animales, componentes medinicos o elfctricos, etc.). La caractedstica me- 
dible de interns puede ser un atributo, como el estado de un componente (defectuoso 
o no defectuoso), la opinibn de una persona con respecto a cierto tema (a favor o en 
contra) o una medicion cuantitativa como el Cl de una persona o el tiempo de dura- 
cion de un componente. Existen dos formas para obtener muestras aleatorias de este 
tipo de poblacion: 

2. Despues de llevar a cabo una mezcla adecuada de los objetos de la poblacibn, se 
extraeuno y se observa la caractedstica medible. Esta observation sera X x . El ob- 
jeto se regresa a la poblacion y esta vuelve a mezclarse; despues se extrae el segun- 
do objeto. X 2 se constituye por la segunda observation. El proceso se continua de 
esta forma hasta que se han extraido rt objetos para tener una muestra de obser- 
vaciones X t , X 2 , ..., X n de la caractedstica X. 

3. Despues de una mezcla adecuada de los objetos que constituyen la poblacion, n 
de estos se seleccionan uno despues de otro sin reemplazo. Este proceso propor- 
ciona una muestra de observaciones X t , X 2 , .... X„ de la caractedstica X. 

Notese que la tecnica 2 constituye un muestreo con reemplazo y la tecnica 3 es 
un muestreo sin reemplazo. En el contexto general de una muestra aleatoria simple, 
la tecnica recibe el nombre de aleatoria. Cuando los objetos se extraen despues de 
una selection equitativa. Por consiguiente, la tecnica de muestreo dos recibe el 
nombre de muestreo aleatorio con reemplazo, y la tecnica tres el de muestreo aleato- 
rio sin reemplazo. En la tecnica dos, cada una de las observaciones X u X 2 , ..., X n 
es una variable aleatoria cuya distribution de probabilidad es identica a la de la po¬ 
blacion, puesto que en cada extraction esta tiene su forma original. En la tecnica de 
muestreo tres, las observaciones X t , X 2 ..., X n tambien son variables aleatorias 
cuyas distribuciones marginales son iguales a las de la poblacion. Es decir, puede 
demostrarse que aun a pesar de que los objetos que se extraen de la poblacion no 
sean reemplazados, la distribution no conditional de X t es identica a la de la pobla¬ 
cion, para toda i = 1,2, ..., n. 

La diferencia basica entre las dos tecnicas es la notion de independencia. En la 

tecnica dos, las observaciones X u X 2 . X„ constituyen un conjunto de variables 

aleatorias independientes e identicamente distribuidas (IID) dado que, por el proce¬ 
so de reemplazo, ninguna observation se ve afectada por otra. En la tecnica tres, a 
pesar de que las observaciones X x , X 2 , .... X„ poseen la misma distribution, no son 
independientes. 

Recuerdese que, para la tecnica uno, el muestreo se lleva a cabo con reemplazo a 
pesar de que la poblacion no se encuentre constituida por objetos tangibles. De 
hecho, la tecnica de muestreo dos es un caso especial de la primera, dado que la po¬ 
blacion no se afecta despues de cada extraction. Sin embargo, es interesante notar 
que puede preferirse el muestreo aleatorio sin reemplazo si el tamano de la poblacion 
es relativamente pequeno*. En estos casos, si el muestreo se lleva a cabo con re- 


* El lector recordara que esto es precisamente lo que constituye una distribucion hipergeometrica tal como 
se discutio en la seccion 4.4. 


www. FreeLibros. com 


7.2 Muestras aleatorias 217 


emplazo es muy probable que el mismo objeto sea seleccionado mas de una vez. Es 
por esta razon que en las encuestas de preferencia el muestreo se hace sin reemplazo. 
Por otro lado, si el numero de objetos en la poblacion es muy grande, es irrelevante 
si el muestreo se lleva a cabo con reemplazo o sin este. Conforme crece el tamaflo de 
la poblacion, el muestreo aleatorio sin reemplazo es, en todos los intentos y para 
cualquier propdsito, igual al muestreo aleatorio con reemplazo. 

A1 hablar de la inferencia estadistica se supondra la existencia de una muestra 
aleatoria, como la descrita por la tecnica de muestreo 1, y que se define de manera 
formal de la siguiente manera: 

Definition 7.1 Si las variables aleatorias X v X 2 , ..., X n tienen la misma funcion 
(densidad) de probabilidad que la de la distribucion de la poblacion y su funcion 
(distribucion) conjunta de probabilidad es igual al producto de las marginales, en- 
tonces AT,, X 2 , .... X n forman un conjunto de n variables aleatorias independientes 
e identicamente distribuidas (IID) que constituyen una muestra aleatoria de la po¬ 
blacion. 


Cuando el objetivo es formular una inferencia estadistica, debe hacerse un in- 
tento honesto para obtener una muestra aleatoria que porporcione la base teorica 
necesaria para la inferencia. Desde un punto de vista practico, lo anterior no siempre 
es facil. Por ejemplo, en muchas ocasiones es dificil decidir cuando se estan mante- 
niendo condiciones identicas durante el proceso de reunir datos en experimentos 
cientificos. Esto es especialmente cierto si los factores ambientales crean condicio¬ 
nes heterogeneas. Sin embargo, es responsabilidad del experimentador decidir cuan¬ 
do una muestra observada de datos es, en gran medida, aleatoria. 

Para ilustrar el proceso de muestreo en un experimento cientifico, supongase 
que se tiene interes en la concentracion de cierto contaminante en un deposito de 
agua. Se coloca una boya que contiene un instrumento para medir el nivel de con¬ 
centracion en el sitio de interes. El instrumento registra el nivel de concentracion 
cada n intervalos. De esta forma, las observaciones X t , X 2 , X n constituyen una 
muestra del nivel de concentracion en el sitio de interes. Antes de que el instrumento 
registre el nivel de concentracion para el /-esimo periodo, la observacion X t es una 
variable aleatoria para i = 1, 2, .... n. El valor registrado x ( (el valor numerico 
correspondiente a la observacion X) es una realizacion de la variable aleatoria. Al 

final de los n intervalos las mediciones .v,, x 2 .que registra el instrumento 

son las realizaciones, o datos muestrales, de las correspondientes variables aleatorias 

A',. X 2 . X„. Sin embargo, es valido preguntarse si la anterior es veraderamente 

una muestra aleatoria. Nadie puede proporcionar una respuesta legitima sin tener 
information adicional. Por ejemplo, <,esta el investigador consciente de todos los su- 
cesos que durante el periodo de muestreo podria causar un cambio significativo en 
el nivel de concentracion del contaminante? <,Considero el lapso de muestreo ade- 
cuado o existen algunas fiuctuaciones temporales que deben ser consideradas? oEs 
probably que el error en el instrumento sea mayor conforme transcurre el tiempo? 
Preguntas como las anteriores deben contestarse antes de dar un juicio definitive 
sobre la aleatoriedad de la muestra. 
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En el contexto de la definition 7.1, la funcion (densidad) conjunta de probabili- 
dad de X,, X 2 , X„ es la funcion de verosimilitud de la muestra dada por 

n 

L(x-,e) = n/to;0). (7-D 

i— I 

endonde x = {*,, x 2 , .... x,,} denota losdatos muestreados. Cuando las realizacio- 
nes x se conocen, L{x\ 6) es una funcibn del parbmetro desconocido 0. La utilidad 
de la funcibn de verosimilitud para estimar parametros se examinara en el capltulo 
ocho. 

Ejemplo 7.1 Se ilustrara el concepto de muestra aleatoria dado en la definicibn 7.1 
mediante lo siguiente: sea X,, X 2 , ..., X„ una muestra aleatoria de n variables alea¬ 
torias IID de una poblacion cuya distribucibn de probabilidad es exponential con 
densidad 

fix; 8) = ^expi~x/6), 0<x<x. 

U 

Cuando se observa X, y se registra su realization x,, 

f(x,-, 6) = - exp(-x,/0), 0<x,<3o. 

V 

Ahora se observa X 2 y se registra su realizacion x r Dado que X x y X 2 son estadistica- 
mente independientes y tienen las mismas densidades marginales, 

fix 2 \x,) = f(x 2 ; 0) - ^ exp (-x 2 /6), 0<x 2 <x>. 

U 

La funcion de densidad conjunta de X, y X 2 es 

fix i, x 2 , 6) = f(x,; d)fix 2 ; 6) = X exp[-(x, + x 2 )/8], 0 < x, < =», i = U 2. 

U 

Por lo tanto, se desprende que para una muestra aleatoria de tamano n 

Lix,,x : . x„;0) = exp[-(xi + x 2 + ••• + x„)/B], 

0 < < *, / = 1.2 . n. 


7.3 Distribuciones de muestreo de estadisticas 

En los comentarios introductorios del capitulo uno se menciono de manera breve que 
las caracteristicas muestrales denominadas “estadisticas” se emplean para hacer infe- 
rencias con respecto a las caracteristicas de la poblacion, las que reciben el nombre 
de “parametros”. El objetivo de esta seccion sera el de examinar con detalle el papel 
que desempenan las estadisticas en relacion con la inferencia. En particular, se desa- 
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rrollarb la notion de una distribution de muestreo de una estadistica, que es uno de 
los conceptos mas importantes en inferencia estadistica. 

Para colocar a las estadisticas en una mejor perspectiva se debe definir y anali- 
zar, de manera formal, un parametro de poblacion. 

\ 

Definitibn 7.2 Un pardmetro es una caracterizaribn numerica de la distributibn de la 
poblacibn de manera que describe, parcial o completamente, la funcion de densidad • 
de probabilidad de la caracteristica de interes. Por ejemplo, cuando se especifica el 
valor del parametro de escala exponencial 9, se describe de manera completa la 
funcibn de densidad de probabilidad 

x /(*; 9) = ^exp(-x/0). 

V 

La oration “describe de manera completa” sugiere que una vez que se conoce el 
valor de 9 entonces puede formularse cualquier proposicion probabilistica de inte¬ 
res. A manera de ilustracion, si 9 = 2, entonces: 

P(A'>4) = ^J exp( -x/2)dx = 0.1353. 

Por otra parte, si se especifica un valor del parametro de forma a,de la distribution 
gama, la funcibn de densidad de probabilidad 

/(*; a, 9) = x a ~' exp( -x/9) 

T (a)(r 

no se encuentra especificada de manera completa, ya que no se ha hecho ninguna 
mencion con respecto al valor del parametro de escala 9. 

La esencia de todo lo anterior es que, dado que los par&metros son pr&cticamen- 
te inherentes a todos los modelos de probabilidad, es imposible calcular las proba- 
bilidades deseadas sin un conocimiento del valor de estos. Es por esta razbn que la 
nocibn de una estadistica y su distribucion de muestreo es muy importante en inferen¬ 
cia estadistica. Esto es, los par&metros o sus funciones se estiman con base en esta¬ 
disticas que, a su vez, se obtienen a partir de la information contenida en una 
muestra aleatoria. 

Antes de dar la definicion de una estadistica, debe notarse que desde un punto de 
vista clasico (no bayesiano), un parametro se considera como una constante fija 
cuyo valor se desconoce. Desde una perspectiva bayesiana un parametro siemprees 
una variable aleatoria con algun tipo de distribucion de probabilidad. Se considerara 
a los parametros, principalmente desde el punto de vista clasico, aunque tambien se 
dara el punto de vista bayesiano, a fin de dar una perspectiva apropiada. 


Definicion 7.3 Una estadistica es cualquier funcibn de las variables aleatorias que 
se observaron en la muestra de manera que esta funcibn no contiene cantidades des- 
conocidas. 
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Considerese la muestra X = {A’,, X 2 , X,,} que consiste de n variables alea¬ 

torias IID con una funcion de densidad de probabilidad /( x; 0) que depende de un 
par&metro desconocido 0. Sup6ngase que se definen funciones como 

TAX) = (X, + X 2 + .» + X„)/n, 

T 2 (X) = (X] + X\ + - + X 2 n )/n, 

TAX) = X t + X 2 , 

y asi sucesivamente. Todas ellas son estadisticas porque se determinan de manera 
completa por las variables aleatorias que contiene la muestra. De manera general, 
denotese una estadistica por T = u(X). Dado que T es una funcion de variables alea¬ 
torias, es en si misma una variable aleatoria, y su valor especifico t = u(x) puede 
determinarse cuando se conozcan las realizaciones x de X. Si se emplea una estadis¬ 
tica T para estimar un parametro desconocido 0, entonces T recibe el nombre de 
estimador de 0, y el valor especifico de t como un resultado de los datos muestrales 
recibe el nombre estimation de 0. Esto es, un estimador es una estadistica que identi- 
fica al mecanismo funcional por medio del cual, una vez que las observaciones en la 
muestra se realizan, se obtiene una estimacion. 

Una estadistica es, sustancialmente, diferente de un parametro. Un parametro es 
una constante pero una estadistica es una variable aleatoria. Ademas, un valor del 
parametro descrito describe de manera completa un modelo de probabilidad (supo- 
niendo una distribution uniparametrica); ningun valor de la estadistica puede de- 
sempefiar tal papel si cada uno de estos depende del valor de las observaciones de las 
muestras. Y dado que las muestras se toman en forma aleatoria, ninguna muestra es 
mas valida que cualquier otra que se haya tornado con el mismo fin. 

Para ilustrar el concepto de una estadistica se dar& solution al siguiente proble- 
ma: supongase que se tiene interes en la duracion promedio de cierta clase de bateria 
miniatura. Se asegura que el proceso de manufactura de esta es el mismo y que se 
emplean materiales identicos. Se decide seleccionar aleatoriamente cinco pilas diarias 
durante 20 dias. Para cada muestra diaria, las cinco baterias se someten a una 
prueba de duracion que consiste en registrar el tiempo de operacion. La prueba ter- 
mina cuando todas dejan de funcionar. Como se supone que el proceso de fabrica- 
cion es el mismo durante el periodo de muestreo, este esquema proporciona 20 muestras 
aleatorias distintas, donde cada una contiene cinco variables aleatorias independientes y 
distribuidas de manera identica. Sea = {X Xj , X 2j , .... X ei eonjunto de varia¬ 
bles aleatorias de layesima muestra para j = 1, 2, .... 20, y x, = {.v iy , \ 2i ..* 5 ,} 

los correspondientes tiempos de duracion observados. Considerese la estadistica. 


7, = (X ,, + X 2l + - + X fJ )/5 

como un estimador del tiempo de duracion promedio de las baterias. Si se supone 
que los tiempos observados son los que aparecen en la tabla 7.1, entonces para la j- 
esima muestra existe una realization t, para la estadistica /,. Es decir, cada muestra 
diaria proporciona una estimacion de la duracion promedio de las baterias. 
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Notese que las estimaciones que aparecen en la tabla para la duration promedio 
tienen una variation que se encuentra entre 140.8 y 157.2 horas. De esta forma, exis- 
te una variabilidad inherente entre estas estimaciones. Ademas, para cualquier esta- 
distica se espera una variabilidad de muestra a muestra, dado que una estadistica es 
una variable aleatoria. De hecho, para cada estadistica existe lo que se conoce 
como su distribution de muestreo, la cual toma en cuenta la variabilidad inherente y 
proporciona los medios necesarios por medio de los cuales puede evaluarse la 
estadistica. Se definira la distribution de muestreo de una estadistica con base en 
muestras aleatorias, de acuerdo con la definition 7.1. 

Definition 7.4 La distribution de muestreo de una estadistica T es la distribuciOn 
de probabilidad de T que puede obtenerse como resultado de un numero infinito de 
muestras aleatorias independientes, cada una de tamafto n, provenientes de la pobla- 
ciOn de interes. 

Dado que se supone que las muestras son aleatorias, la distribuciOn de una esta¬ 
distica es un tipo de modelo de probabilidad conjunta para variables aleatorias inde¬ 
pendientes, en donde cada variable posee una funciOn de densidad de probabilidad 
igual a la de las demas. De manera general, la distribuciOn de muestreo de una esta¬ 
distica no tiene la misma forma que la funciOn de densidad de probabilidad en la dis¬ 
tribuciOn de la poblacion. 

Para ilustrar lo anterior, considerese la distribuciOn de muestreo de una estadisti¬ 
ca para los 20 promedios muestrales dados en la tabla 7.1. Mediante el empleo de los 
metodos del capitulo uno, se agrupan las 20 realizaciones en cinco clases y se ob- 
tienen las frecuencias relativas que aparecen en la tabla 7.2. 


TABLA 7.1 Tiempos de duration (en horas) observados para una muestra aleatoria de bate- 
rias 


Numero de muestra 1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

163 

159 

150 

136 

136 

138 

155 

158 

135 

166 

132 

144 

125 

157 

146 

145 

145 

150 

144 

142 

154 

139 

139 

168 

158 

150 

151 

153 

148 

156 

152 

146 

134 

158 

154 

138 

154 

151 

150 

154 

148 

144 

156 

167 

156 

158 

141 

138 

148 

160 

Promedio 

de la muestra 149.8 

146.4 

140.8 

157.2 

150.0 

145.8 

149.2 

150.0 

145.0 

155.6 

Numero de muestra 11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

150 

154 

148 

149 

150 

147 

158 

164 

153 

135 

152 

150 

166 

158 

138 

151 

147 

136 

160 

150 

163 

141 

148 

139 

153 

161 

141 

143 

156 

164 

161 

159 

149 

146 

151 

142 

130 

137 

142 

152 

139 

153 

154 

136 

161 

149 

147 

152 

156 

144 

Promedio ' 

de la muestra 153.0 

151.4 

153.0 

145.6 

150.6 

150.0 

144.6 

146.4 

153.4 

149.0 
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TABLA 7.2 Grupos y frecuencias relativas para las 20 medias muestrales 


Limites de close 

Frecuencia ■ j 

de la close . 

, Frecuencia relativa 

140.6-144.0 

1 

0.05 

144.1-147.5 

6 

v 0.30 

147.6-151.0 

7 

0.35 

151.1-154.5 

4 

0.20 

154.6-158.0 

2 

0.10 

Total 

20 

1.00 


A partir de estas frecuencias relativas es evidente que la mis alta concentraci6n 
de tiempos de duracion promedio se encuentra entre 147.6 y 151 hor^, e.. donde los 
tiempos de duraci6n promedio por debajo de K 4 horas o por encima de 154.6 tienen 
una probabilidad muy pequefia. La distribucion de muestreo de una estadistica hace 
posible este tipo de analisis de probabilidad, esencial para valorar el riesgo inherente 
cuando se formulan inferencias. 

Posteriormente se enunciaran algunos teoremas basicos que permiten obtener las 
distribuciones muestrales de estadisticas importantes como la media X y la varianza 
S 2 muestral. Se usara de manera frecuente la funcion generadora de momentos, dado 
que esta determina univocamente una distribucion de probabilidad. 

Teorema 7.1 Sea X,, X 2 , X„ un conjunto de n variables aleatorias indepen- 
dientes cada una con funciones generadoras de momentos m Xl (t), m x .(t), ..., m Xn (t). 
Si 

Y = Q\X\ 4- a 2 X 2 + ••• 4- a„X n , 


eri donde a u a 2 , .... a„ son constantes, entonces: 

m Y (t) = m x (ad)m Xi (a 2 t) ■■■ m Xn (a„t). 

Demostracion: Mediante el empleo de la definicion y la hipotesis de independen¬ 
ce, se tiene 

m Y (t) = £{exp[/(a,A' l + a 2 X 2 + ••• + a n X„)]} 

= E[exp(taiX,) exp (ta 2 X 2 ) — exp (ta n X„)] 

= £[exp(m,^,)]£'[exp(m 2 ^ 2 )] ••• £[exp(m„ZJ] 

= m Xl (o,t)m x ,(a 2 t) ■■■ m Xn (a n t). 

De esta forma, la funcion generadora de momentos de una combinacion lineal de n 
variables aleatorias independientes es el producto de las correspondientes funciones 
generadoras de momentos con argumentos iguales a las constantes de tiempo t. 

www. FreeLibros. com 




7.3 Distribuciones de muestreo de estadisticas 223 

Teorema7.2 Sea X,, X 2 , .... X n un conjunto de variables aleatorias independien- 
tes normalmente distribuidas con medias E(X) - pi, y varianzas Var(X { ) = a] 
para i = 1, 2, n. Si : , - v:rr,-.- 

y = A^i + a 2 X 2 + •” + a n X n , 

s ... \ . . ... ... . 

endonde a,, a 2 , a„ son constantes, entonces y es una variable aleatoria con 
distribucion normal y media 

E{Y) = a,p, + a 2 p 2 + *~ + a„p„ 

y con varianza 


Var(Y) = a]<j] + a\a\ + ••• 4- ala]. 


Demostracidn: Dado que X, se encuentra normalmente distribuida, su funci6n ge- 
neradora de momentos es 

= exp [fid + (a]t 2 )/2}. 

De acuerdo con el teorema 7.1, la funcion generadora de momentos de Y es 


m Y (t) = m Xl (ad)m X2 (a 2 t) ••• m x „(a n t) 


- exp[/a,a,/ + (a,cr,n/2] ••• Q\p[p n a n t + {a n a n t )/2] 


exp 


t + ( f'Zajoj / 2 


Por lo tanto, Y se encuentra normalmente distribuida con media £" = , a,/x, y varian¬ 
za 1" = 1 a) a-]. 

Del teorema 7.2 se desprende que si a, = 1 para i = 1,2 , ... n. entonces la 
suma de variables aleatorias independientes normalmente distribuidas tambien 
posee una distribucion normal con media y varianza igual a la suma de las medias 
y las varianzas de cada una de las variables aleatorias. La mayor parte de las veces 
el resultado anterior se conoce como la propiedad aditiva de la distribucibn nor¬ 
mal. Debe notarse que la hipotesis de normalidad no es necesaria para obtener las 
formulas de la media y la varianza de Y en el teorema 7.2. De hecho, con base en el 
teorema 6.1, si X,, X 2 , .... X„ es un conjunto de n variables aleatorias IID con me¬ 
dias E{Xj) = p, y varianzas Var(X ,) = a], i =1, 2, .... n, entonces para 
Y — a 1 A "1 4- o 2 X 2 4- ••• 4- linX", 

n 

E(Y) = £ a,p, 

/= I 

y (7-2) 

Vcir(Y) = 2 
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en donde, de nuevo, a,, a 2 , .... a„ son constantes. 

Del teorema 7.2 surgen algunas aplicaciones interesantes. La siguiente constituye 
un ejemplo tipico. 

Ejemplo 7.2 Sup6ngase que para un arbol de levas y un cojinete, el diametro exter- 
no del primero A", y el di&metro interno del segundo X 2 son variables aleatorias inde- 
pendientes con una distribution normal, con medias E(X x ) = 3.25 cm, £( X 2 ) = 3.3 
cm y desvaciones estandar d.eXX ,) = 0.005 cm y d.e.(X 2 ) = 0.006 cm, respectiva- 
mente. El interes recae en la diferencia entre X 2 y X, , que es el espacio que existe 
entre el di&metro interno del cojinete y el di&metro externo del arbol de levas. El es¬ 
pacio se representa por Y, donde Y = X 2 - X x . Si al armarse una maquina existe un 
apareamiento aleatorio entre los arboles de levas y los cojinetes, debe obtenerse el 
valor del espacio que existe entre estos _y 00(M , de manera tal que la probabilidad de 
que Y tenga un valor menor que este sea de 0.004. 

Dado que X , y X 2 son variables aleatorias independientes, se aplica el teorema 
7.2 con a, = -1 y a, = 1. De esta forma 

E(Y) = (I )E(X 2 ) + (- 1 )E(X t ) = 0.05, 
y 

d.e.(Y) = V(D 2 (0.006)- + (-1) 2 (0.005) 2 = 0.00781. 

Esto es, Y ~ N( 0.05, 0.00781). Entonces 

P(Y < y 0 .oo4) = 0.004 
o 

P[Z < (y„,KM - 0.05)/0.00781] = 0.004, 

pero 

P[Z< -2.65] = 0.004; 

asi pues 

fyo.004 - 0.05)/0.00781 = -2.65, 

y y» (Ki 4 . De acuerdo con lo anterior se necesita un espacio no menor de 0.0293 cm 
para las condiciones dadas. 

7.4 La distribucion de muestreo de X 

Una de las estadisticas mas importantes es la media de un conjunto de variables alea¬ 
torias independientes e identicamente distribuidas. Esta estadistica tiene un papel 
muy importente en problemas de toma de decisiones para medias poblacionales des- 

conocidas. Sea X x . X 2 . X„ una muestra aleatoria que consiste de n variables 

aleatorias IID tales que E(X,) = /i y Var( X,) = a 2 para toda i = 1,2. n. 

Entonces la estadistica 


X = (A', - X 2 + ••• + X„)/n 
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se define como la media de las n variables aleatorias IID o, sencillamente, me¬ 
dia muestral. N6tese que una vez que se conocen las_realizaciones x u x 2 . x„ de 

X,, X 2 . X„, respectivamente, la realizaci6n I de A' se obtiene promediando los 

datos muestraleS. Si en (7.2) a, = 1 /n, i = 1, 2, n entonces el valor esperado y 
la varianza de X son * 

— n r 

E(X) = 2 = n(p/n) = P (7.4) 

i= I 

y 

~~ n l 

Var(X) = 2 “O' 2 = n{(//n 2 ) = <j 2 /n , (7.5) 

x i = i n 

respectivamente, en don^e p y i t 2 son la media y la varianza de la distribucidn de la 
poblacion a partir de la cual se obtuvo la muestra. Con respecto a este resultado, lo 
importante es recordar que es vdlido sin importar la distribucidn de probabilidad de 
la poblacidn de interes siempre y cuando la varianza tenga un valor finito. A partir 
de (7.4), la desviacion estandar de A es 

d.e.(X) = cr/\/n , (7.6) 

la cual, enalgunas ocasiones, recibe el nombre de error estandar de la media. 

Notese que conforme el tamaflo de la muestra crece, la desviacion estandar, y de 
esta forma la variabilidad, de X disminuye. En otras palabras, si el tamafio de la 
muestra crece, la precision de la media muestral para estimar la media poblacional 
aumenta. Por ejemplo, si se extrae una muestra aleatoria den = 25, X debeii tener 
una precision de \/25 = 5 veces mas de estimar la media poblacional que la que 
tendria una sola observacion. Lo anterior es una propiedad muy ventajosa de la es- 
tadistica X dado que asegura que para una muestra relativamente grande, se espera 
que la realizacion de X se encuentre muy cercana a la media poblacional fi. Como 
ilustracion adicional, supongase que se calcula la desviacibn estandar de X para dis- 
tintos valores de n con <x = 10 y se grafican los puntos resultantes, como se indica 
en la figura 7.1. Por la naturaleza de 7.6, la desviacion estandar de A" sufre una dis- 
minucion sustancial en su valor conforme n toma valores cada vez mas grandes, 
pero si n es mayor de 30 o 40 este comportamiento cesa. Por lo tanto, en esencia, un 
tamano grande de muestra no resulta razonableen cuanto al costo, si se hacen infe- 
rencias con respecto a m con base en X. 

A continuacion se enuncia y demuestra un teorema con respecto a la distribucion 
de muestreo de X si la muestra se encuentra constituida por n variables aleatorias in- 
dependientes normalmente distribuidas. 


Teorema 7.3 Sea X f , X 2 , ■■■, X„ una muestra aleatoria que consiste de n va¬ 
riables aleatorias independientes normalmente distribuidas con medias E(X,) = p 

y varianzas Var(X f ) = cr 2 , i = 1,2. n. Entonces la distribucion de la media 

muestral X es normal con media p y varianza o 2 /n. 
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\ . \ 



FIGURA 7.1 Comportamiento tipico de la desviacion estandar de X como funcion del ta- 
maflo de la muestra 


Demostracion: Este teorema es un corolario del teorema 7.2. Esto es, sea a, = ]/n; 
dado que las medias y las^varianzas son iguales, respectivamente, la funci6n gene- 
radora de momentos de X es: 


mX(t ) = exp 




. n 



= exp[/x/ + (t 2 cr 2 )/2n], 

que es la funcion generadora de momentos de una variable aleatoria normalmente 
distribuida con media p y varianza cr 2 /n. De esta forma, la funcion de densidad de 
probabilidad de X cuando se muestrea una poblacion cuya distribucion es normal, 
esta dada por 


fix; fi, cr/\Jn) 


V* T n{x - m ) 2 

~/x = ~~ exp- - 2— 

ylircr L 2cr 


- x < x < *. (7.7) 


Ejemplo 7.3 Se tiene una maquina de llenado para vaciar 500 gr de cereal en una caja 
de carton. Supongase que la cantidad de cereal que se coloca en cada caja es una 
variable aleatoria normalmente distribuida con media 500 gr y desviacion estandar 
igual a 20 gr. Para verificar que el peso promedio de cada caja se mantiene en 500 gr 
se toma una muestra aleatoria de 25 de estas en forma periodica y se pesa »*i conteni- 
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do de cada caja. El gerente de la planta ha decidido detener el proceso y encontrar la 
falla cada vez que el valor promedio de la muestra sea mayor de 510 gr o menor de 
490 gr. Obtener la probabilidad de detener el proceso. > • 

Sean A ',, X 2 , ..., X 2 s variables aleatorias independientes normalmentedistribui- 
das, las cuales representan la cantidad de cereal contenido en las cajas de una mues¬ 
tra aleatoria dada. Por hipotesis X { ~ N( 500, 20), i = 1,2.25. Por el teo- 

rema 7.3, el promedio muestral X tambien se^encuentra normalmente distribuido 
con media 500 y desviacion estandar 20/\j25 = 4. La probabilidad deseada es 
igual a uno menos la probabilidad de que X se encuentre entre 490 y 510 gr; de esta 
forma 


/•{Detention del proceso) = 1 - P(490 < X < 510) 

= ,. ^90 ^ 50 0 <Z< 510 - 500 ^ 

= 1 - P(-2.5 < Z < 2.5) 

= 0.0124. 

Ejemplo 7.4 Demostrar que si X,,X 2 , ...,X„ son n variables aleatorias indepen¬ 
dientes exponencialmente distribuidas con funcion de densidad de probabilidad 

fix; 6) = ^-exp(-.x/0) x > 0, 

0 

entre X tiene una distribucion gama. 

Recuerdese que la funcion generadora de momentos de una variable aleatoria ex¬ 
ponencialmente distribuida es (1 - 6t)~'. De esta forma, para cada X : de la 
muestra, 

mjtHO = (1 - et)~'. 

Del teorema 7.1 con a, = \/n, i = 1, 2, ..., n, se desprende que la funcion gene¬ 
radora de momentos de la media muestral X es 

mxU) = m Xl (t/n)m X2 (t/n) ■■■ m Xn (t/n) 

= [1 - (0t/n))~ l [ 1 - (6t/n)]-' - [1 - iet/n)Y' 

= [1 - (0t/n)]-\ 

Pero la expresion anterior es la funcion generadora de momentos de una distribu¬ 
cion gama con parametro de forma n y parametro de escala 8/n. De acuerdo con lo 
anterior, cuando se muestrea una poblacibn^uya distribucion de probabilidad es ex¬ 
ponential, la densidad de probabilidad de X esta dada por 

f(x, n, d/n) — — —; .v" 1 exp( — n.T/fl), x > 0. (7.8) 

1 {n)v 
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N6teseque sien lasexpresiones(5.47) y(5.48) se reemplaza a con ny 6 con 6/n 
se obtiene 

E(X) = n- = 0 (7.9) 

n 

y • * ; 

_ 

Var(X) = n— = 6r/n, (7.10) 

n~ 

como era de esperarse ya que 0 y 6 2 son la media y la varianza, respectivamente, de 
una variable aleatoria con distribucion exponencial. 

De la section 5.5, recuerdese que si el parametro de forma de una distribucion 
gama tiene un valor grande, entonces los valores de probabilidad para una variable 
aleatoria gama pueden aproximarse, en forma adecuada, por una distribucion nor¬ 
mal. Dado que r m , muestrear una distribucion exponencial con par&metro 6 X tiene 
una distribucion gama con media 6, y desviacion estandar 0/y/n , entonces, para n 
grande 



es, en forma aproximada, N( 0, 1). 

Ejemplo 7.5 Con base en los experimentos, la duration de un componente electrico 
se encuentra exponencialmente distribuida con una vida media de 100 horas. Si del 
proceso de production se toma una muestra aleatoria de 16 componentes, ^cu&l es 
la probabilidad de que la vida media muestral sea mayor de 120 horas? 


De (7.9) y (7.10), la media de A" en 100 horas y la desviacion estandar tiene un 
valor de 100/V16 = 25 horas. Si se supone que el valor del parametro de forma n 
= 16 es suficientemente grande para emplear la aproximacion dada por (7.11), se 
tiene 


P(X> 120) = P\Z> 


120 - 100 


= 0.2119. 


Por comparacion, la probabilidad de que X > 120 pueda calcularse mediante el 
empleo directo de la funcion gama incompleta /(n, p ), se encuentra definida por 
(5.55); en este caso ii = (16)(120)/100\/I6 y p — 16 - 1. De esta forma: 

P(X> 120) = 1 - /(4.8, 15) = 0.2021. 

De manera muy breve se establecio ya que la distribucion de muestreo de X es 
normal cuando este se lleva a cabo a partir de una poblacion que tiene una distribu¬ 
cion, ya sea normal o exponencial. <,Que ocurre cuado no puede especificarse la 
distribucion de probabilidad de la poblacion a partir de la cual se obtiene la muestra? 
Es decir, <,cual es la distribucion de muestreo (aproximada) de A", sin tener en cuenta 
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la de las variables aleatorias de la muestra? Para obtener una idea con respecto a la 
distribucibn de muestreo de X cuando el modelo de probabilidad de la poblacibn de 
interes no se especifica, considerese un estudio de simulacibn en el que los valores 
aleatorios se generan mediante los procedimientos dados en la seccion 5.9. .; 

Supbngase que se generan 50 muestras, cada una de tamaflo n - 10, a partir de 
una distribucibn (le Poisson con parametro X = 2. Para cada muestra se calcula la 
media muestral, produciendose asi 50 realizaciones de la estadistica X. Estos valores 
se agrupan y se determinan sus frecuencias relativas. Se repite el proceso pero con 
n = 40 como tamafto de la muestra en lugar 10. Se repite el proceso pero en lugar de 
generar valores aleatorios a partir de una distribucion de Poisson, se generan a partir 
de una distribucion uniforme sobre el intervalo (0,1). En la figura 7.2 se ilustra la 
distribucion de frecuencia relativa para cada uno de los cuatro casos. Notese que 
cuando n = 10, no existe un patron tipico en la distribucion de X. Sin embargo, cuan¬ 
do n = 40 la distribucibn de X definitivamente toma una forma de campana y de esta 
forma se procede a una distribucibn normal, tanto para el modelo de Poisson como 
para el uniforme. 






FIGURA 7.2 Distribuciones de frecuencia relativa de A' cuando el muestreo se Ileva a cabo 
sobre una distribucion de Poisson o una uniforme para n = 10 y n = 40 
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Con base en este limitado estudio de simulation, parece ser que para un valor 
grande de n, la distribution de X es aproximadamente normal. De hecho, no impor- 
ta el tipo de modelo de probabilidad a partir del cual se obtenga la muestra; mientras 
la media y la varianza existan, la distribucibn de muestreo de X se encontrarS apro¬ 
ximada poriM/n, <r/\fri) para valores grandes de n. 

• Lo anterior coastituye uno de los mas importantes teoremas en inferencia esta- 
distica, y se conoce como teorema central del llmite. 

Teorema 7.4 Sean X x , X 2 , .... X n n variables aleatorias IID con una distribucion 
de probabilidad no especificada y que tienen una media m y una varianza cr 2 finita. 
El promedio muestral X = (X } + X 2 + ••• + X n )/n tiene una distribucion con 
media n y varianza cr 2 /n que tiende hacia una distribucion normal conforme n tien- 
dea oo. En otras palabras, la variable aleatoria {X - p)/(o-/\Jn) tiene como limite 
una distribucion normal estandar. (En un apendice al final de este capitulo se pro- 
porciona un esbozo de la demostracion da este teorema.) 

La esencia del teorema central del limite recae en el hecho de que para n grande, 
la distribucion de ( X - p.)/(cr/yjn) es, en forma aproximada, normal con media 
cero y desviacion estandar uno sin importar cual sea el modelo de probabilidad a 
partir del que se obtuvo la muestra. Debe notarse que si el modelo de probabilidad 
de la poblacibn es semejante a una distribucion normal (esto es, si es simetrico y existe 
una concentration relativamente alta alrededor del punto de simetria), la aproxima¬ 
cion normal sera buena aun para pequeflas muestras. Por otro lado, si el modelo de 
la poblacion tiene muy poco parecido a una distribucion normal (por ejemplo, existe 
una alta asimetria), la aproximacion normal s61o sera adecuada para valores rela¬ 
tivamente grandes de n. En muchos casos, puede concluirse de forma segura, que 
la aproximacion sera buena mientras n > 30. Por lo tanto, la variable alea¬ 
toria 



se emplea para formular inferencias acerca de fi cuando se conoce el valor de la va¬ 
rianza poblacional a 1 . La variable Z es N(0, 1) cuando el muestreo se lleva a cabo 
sobre una poblacion que tiene una distribucion normal y es, en forma aproximada, 
MO, 1) para cualquier otro modelo cuando n es grande. 

Ejemplo 7.6 Supongase que el numero de barriles de petroleo crudo que produce 
un pozo diariamente es una variable aleatoria con una distribucion no especificada. 
Si se observa la production en 64 dias, seleccionados en forma aleatoria, y si se sabe 
que la desviacion estandar del numero de barriles por dia es a = 16, determinese la 
probabilidad de que la media muestral se encuentre a no mas de cuatro barriles del 
verdadero valor de la production por dia. 

Puesto que n es lo suficientemente grande, la distribucion de X es,_en forma 
aproximada, normal con media m y desviacion estandar <r/\n — 16/\/64 = 2.En 
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forma equivalente, la distribucion de Z = (X - n)/2 es, aproximadamente, 

N{ 0, 1). De acuerdo con lo anterior, la probabilidad deseada es: 

. . , - . • •; <• ■. a,: • , - , r . 

' - mI< 4) = P(/z -4<X<fi + 4) . i v . 

■v ■' l\r ■ ■ 

x = P[(li - 4 - n)/2 < Z < (fi + 4 - yu)/2] 

' ' = p{-2<z<2) rr “;' 

= 0.9544. 


7.5 La distribucion de muestreo de S 2 

Otra estadistica importante empleada para forr>ul? r inferencias con respecto a las 
varianzas de la poblacion es la varianza muestral denotada por S 2 . Recuerdese que 
S 2 es una medida de la variabilidad e indica la dispersibn o extension entre las obser- 
vaciones. Dado que la dispersion es una consideracion tan importante como la ten- 
dencia central, el significado de S 2 para formular inferencias de cr 2 es comparable 
con el que dene X para formular inferencias con respecto a /i. 

En esta seccion se desarrollara la distribucion de muestreo de S 2 cuando este se 
lleva a cabo sobre una poblacion que tiene una distribucion normal. Para comenzar, 
es necesario suponer que n es conocida y cr 2 no. Asi, S 2 se encuentra definida por 

5 2 = i (X,- - n) 2 /n, (7.13) 

1=1 

en donde X u X 2 , .... X n constituye una muestra aleatoria de una distribucion nor¬ 
mal con media n y varianza cr 2 desconocida. Para determinar una distribucion de 
muestreo que permita hacer inferencias sobre cr 2 con base en S 2 definida por (7.13), 
se enuncia y demuestra el siguiente teorema. 

Teorema 7.5 SeanA',, X 2 , ..., X n una muestra aleatoria de una distribucion nor¬ 
mal con media /* y varianza o 2 . La distribucion de la variable aleatoria. 

Y=t (X, - n) 2 /a 2 
1 = 1 

es del tipo chi-cuadrada con n grados de libertad. 


Demostracion: Dado que X, ~ N(fi, cr), i = I, 2, Z, = (X, - m)/ <t 

define n variables aleatorias normales estandar independientes, se tiene: 


Sz , 2 
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Del teorema 7.1, ; . 

m Y (t) = m z p)m^t) ••• m z i(t) ' 

= (1 - 2ty' n {\ - 2t)~' n ••• (1 - 2t)~ vi , 

dado que el cuadrado de una variable aleatoria normal estandar tiene una distribu¬ 
tion chi-cuadrada con un grado de libertad (vease el ejemplo 5.14). De esta forma se 
tiene 

m Y (t) = (1 - 2 ty n, \ 

que es la funcion generadora de momentos de una distribution chi-cuadrada con n 
grados de libertad. De acuerdo con lo anterior, Y ~ X 2 „. 

Ejemplo 7.7 Considerese una medicion fisica proporcionada por un instrumento 
de precisibn, en donde el interes recae en la variabilidad de la lectura. Supongase' 
que, con base en la experiencia, la medicion es una variable aleatoria normalmente 
distribuida con media 10 y desviacibn estandar igual a 0.1 unidades. Si se toma una 
muestra aleatoria procedente del proceso de manufacture de los instrumentos de ta- 
mano 25, £cual es la probabilidad de que el valor de la varianza muestral sea mayor 
de 0.014 unidades cuadradas? 

Con base en el teorema 7.5, la probabilidad de que S 2 > 0.014, cuando el 
muestreo se lleva a cabo sobre 7V( 10, 0.1) con n = 25 es igual a la de 

P(Y> ns 2 /<r) = /»[r> (25)(0.014)/0.01 ] 

= P(Y > 35) 

= 1 - P(Y^ 35) 

en donde Y ~ X 25 . De la tabla E del apendice, el valor d eP(Y 35 ) es, aproxima- 

damente, 0.9; de esta forma 


P( Y > 35) - 0.1, 

y la probabilidad de que el valor de la varianza muestral sea mayor de 0.014 unida¬ 
des cuadradas, es alrededor de 0.1 para las condiciones dadas. 

Desde un punto de vista practico, la varianza muestra tal como se encuentra defi- 
nida por (7.13) tiene poco uso, ya que es muy raro que se conozca el valor de la media 
poblacional ft. De acuerdo con lo anterior, si se muestra una distribucion normal con 
media y y varianza cr 2 , la varianza muestral se define por 

n 

S 1 = £ (Xi - X) 2 /(n - 1). (7.14) 

i= I 

En el capitulo ocho se vera por que se emplea el divisor (n - 1). El reemplazo de la 
media desconocida y por la muestral X da origen a la presencia de otra estadistica en 
la definicion de S 2 . De esta manera, para determinar la distribucion de muestreo de 
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S\ como se encuentra definida por (7.14), y con base en una muestra aleatoria pro- 
veniente de una distribution normal, debe tomarse en cuenta el promedio de la mues¬ 
tra X. Como resultado se tiene que la distribucibn de muestreo de (n - 1 )S 2 /a 1 
es tambien una distribucibn chi-cuadrada con n - 1 grados de libertad. A fin de 
probar lo anterior, primero se demostrarci un teorema muy util que involucra la 
suma de dos variables aleatorias independientes chi-cuadrada y entonces se escri¬ 
be la expresibn (7.14) en una forma equivalente, con objeto de aprovechar este teo¬ 
rema. 

Teorema 7.6 Si A", y X 2 son dos variables aleatorias independientes y cada una 
tiene una distribucion chi-cuadrada con v, y i> 2 grados de libertad respectivamen- 
te, entonces: 

" Y = X, + X 2 

tambien tiene una distribucibn chi-cuadrada con v, + v 2 grados de libertad. 

Demostracion: del teorema 7.1, la funcibn generadora de momentos de Y es 

m Y (t) = m Xl {t)m x it) 

= (1 - 2 /)“*' ,/2 (l - 2/)" 1,2/2 
= (1 - 2 

que es la funcibn generadora de momentos de una variable aleatoria chi-cuadrada 
con v, + v 2 grados de libertad. 

Ahora se deducira la distribucion de muestreo de (n - l)S 2 /o- 2 ; de (7.14) se 
tiene que 

n 

(n - 1)5 2 = 2 (X, - 

f = l 

pero 

n n 

2 (X, -X) 2 = 2(X i ~n-X+ n) 1 

i= 1 i= I 


= 2 - H)-(X - ju.)] 2 

/= I 

n 

= 2 [(A', - M) 2 - 2(X, - n)(x - n) + (X- IM ) 2 ) 

i = I 

n n 

= 2 (A'/ - n) 2 - 2(X - M ) 2 (X, — fi) + n(X - n) 2 

i = I i=\ 

n 

- 2 (A 1 , ~ /x) 2 ~ 2(X - n)n(X - n) + n(X - t±Y 

i = I 

= 2 (*,- - M) 2 - n(X - ix) 2 . 

f = I 
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De esta forma 

n 1 

(n - 1)S 2 + n(X - » 2 - 2 (*/ - M) 2 - 

‘ ' ' /= I •• r - ’• 

A1 dividir ambos miembros de la expresion anterior por la varianza poblacional <r 2 
se tiene 

(n - 1)S 2 , n(X - m) 2 2" =i (^, -m) 2 

2 + 2 ~ 2 ’ 

(T O- (T 

O 


(n - 1)5 2 ( X - m V = £?-.(*,■ - m) 2 

^ 2 W/vV 


(7.15) 


Del teorema 7.15, se desprende que 2|' = | (A', - n) 2 /a 2 tiene una distribu- 
cion chi-cuadrada con n grados de libertad De manera similar, [(X - fj.)/a/y/n] 2 
tambien posee una distribution chi-cuadrada con un grado de libertad, dado 
que (X - ix) /(<r/ \fn) es MO, 1). Por lo tanto, si se supone que (n - 1 )S 2 /cr 2 y 
[(A" - /x) / a / \/n] 2 son variables aleatorias independientes, entonces, por el teorema 
7,6, cuando se muestrea una poblacion cuya distribution es normal con media y va- 
rianza desconocida, la distribution de (n - 1 )5 2 /cr, es chi-cuadrada con n - gra¬ 
dos de libertad. Para demostrar la independencia se invita al lector a que consulte la 
referencia [3]. La funciOn de densidad de probabilidad dey = (n - 1 )S 2 /(t 2 se 
desprende de (5.58) y est& dada por: 


/(y; n - 1) = [ 


1 


Win - l)/2]2‘ 
U 


in — I )/2 y 


Jin- D/21-1 


exp( —y/2) y > 0, 


(7.16) 

para cualquier otro valor. 


Notese que, dado que Y ~ X 2 _,, E(Y) = n - 1 y Var(Y) = 2 (n - 1). 
Ademas, ya que Y = (n - \)S 2 /a 2 , S 2 = o- 2 Y/(n - 1). Por lo tanto 

2 

E{S 2 ) = E[a 2 Y/(n - 1)] = —~~E(Y) = o- 2 , (7.17) 

(n - I) 

y 

4 2 Q- 4 

Var(S 2 ) = Var[a 2 Y/(n - 1)] = ---s Var(Y) = -(7.18) 

(n - I)‘ n - 1 



'■Ik 


7.6 La distribucion t de Student 

Se recordara de la section 7.5 que cuando se muestrea una distribucion normal con 
desviacion estandar conocida cr, la distribucion de Z = (X - ft)/ (cr/ n) es MO, 
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1). Desde un punto de vista practico, la necesidad de conocer cr impide formular in¬ 
ferences con respecto a n debido a que generalmente no se conoce el valor de la 
desviacidn estandar de la poblaci6n. Dada la<disponibilidad de una muestra aleato- 
ria, el camino 16gico que se sigueen este'caso esleemplazar cr con una estimacidn s, 
que es el valor de la desviacidn est4ndar muestral S. Desafortunadamente, cuando lo 
anterior se lleva a cabo, la distribucion de (X -/*)/($/V«) no es N( 0, 1), aun 
cuando la muestra provenga de una distribucidn normal. Sin embargo, es posible de- 
terminar la distribucion de muestreo exacta de ( X - /i)/(S/\A0 cuando se 
muestrea N(fi, cr), con g y <r 2 desconocidos. Para finalizar esta seccion se exami- 
naran los aspectos teoricos de lo que se conoce como la distribucion t de Student.* 
Supongase que se realiza un experimento en que se observan dos variables aleato- 
rias X y Z; X tiene una distribucion chi-cuadrada con v grados de libertad y Z una 
distribucion normal con media cero y desviacion estandar uno. Sea T otra variable 
aleatoria que es funcion de X y Z, de manera tal que 



(7.19) 


Es decir, T se define como el cociente entre una variable aleatoria normal estandar y 
la raiz cuadrada de una variable aleatoria chi-cuadrada dividida por sus grados de li¬ 
bertad. El conjunto de todos los posibles valores de la variable aleatoria T es el inter¬ 
val (— », 3c) puesto que los valores de Z se encuentran en este y los valores de X 
son positivos. El valor 


t - z 

Vx/v 

recibe el nombre de valor de la variable aleatoria de t de Student. Lo anterior lleva al 
siguiente teorema. 

Teorema 7.7 Sea Z una variable aleatoria normal estandar y X una variable aleato¬ 
ria chi-cuadrada con v grados de libertad. Si Z y X son independientes, entonces la 
variable aleatoria 


yx/v 

tiene una distribucion / de Student con v grados de libertad y una funcion de densi- 
dad de probabilidad dada por 

/(,; v ) = [} + {t 2/ v)] -w + n,2' _=*<,<* „>o. (7.20) 

\jTTV rv/2) 

La deduccion de la funcion de densidad t de Student aparece en un apendice al final 
de este capitulo. 

De (7.20) se observa que el parametro de la distribucion t es v, que, al igual que 
para la distribucion chi-cuadrada, recibe el nombre de grados de libertad. Para cual- 

* W. Gosset, desarrollo en 1908 la distribucion t, quien publico su trabajo bajo el seudonimo de “Student . 
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quier v > 0 , la distribution t es simetrica con respecto al origen y la funcibn de 
densidad tiene su valor maximo cuando / = 0. De la figura 7.3 es evidente que la 
forma de la funcion de densidad / de Student es muy similar a la de la densidad nor¬ 
mal estandar y con los extremos de la distribucibn t menos pronunciados que los de 
la distribucibn normal. De hecho, conforme se tiene un numero mayor de grados 
de libertad, la distribution t de Student tiende hacia la normal estdndar. 

Puede demostrarse que el valor esperado de T es 

E(T) = 0 v>\, (7.21) 

y la varianza esta dada por 

Vctr(T) = v/(v - 2) v > 2. (7.22) 

En la tabla F del apendice se encuentran los valores cuantiles tales que: 

P(T =s /, _„_,.) = j /(/; v)dt = 1 - a, 0^a=sl. (7.23) 

para los distintos valores de v y de las proporciones acumulativas seleccionadas 
1 - a. Por ejemplo, si v = 15. 

P(T =£ /„.9o.i5) - P(T^ 1.341) = 0.90, 

P(T < Wn) = P(T^ 1.753) = 0.95, 

P(T to. 99 . 15 ) = P(T^ 2.602) = 0.99. 

Dado que la distribution t es simetrica con respecto al cero, para a > 0.5 los 
valores cuantiles t x seran negativos pero sus magnitudes seran las mismas que las 



FIGURA 7.3 Comparacion entre las densidades normal estandar y / de Student 
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de los correspondientes valores que se encuentran en el lado derecho. De esta forma, 
para v = 15, . - 


t 0 .ms) •AT* -1.341) = 0.10,^ 
P(T*t 0 .os. is) = P(T* -1.753) = 0.05, ~J 
P(T* /aous) = W* -2.602) = 0.01. 



A fin de ilustrar la similitud que existe entre la distribucion / de Student y la nor¬ 
mal estandar para valores relativamente grandes de v, en la tabla 7.3 se encuentra 
una comparacion entre los valores cuantiles t y los correspondientes valores norma- 
les estcindar para valores crecientes de v. Para a = 0.1 o 0.05, la concordance se en¬ 
cuentra en aproximadamente 0,05 unidades, aun para valores tan bajos de v como 
30. De hecho, muchos autores sugieren que, desde un punto de vista practico, es 
muy poca la ganancia que se tiene al emplear la distribucion t de Student en lugar de 
la normal estandar cuando v 5= 30. 

Recuerdese que para formular inferencias con respecto a /z. cuando el muestreo 
se lleva a cabo sobre una distribucion normal con media y varianza desconocidas, se 
necesita determinar la distribucion de (X - iJ.)/(S/\'n). Cuando se muestrea una 
distribucion N(fi. a) se sabe, del teorema 7.3, que la distribucidn de (X - fj.)/(cr/y'n) 
es M0, 1). Para la misma condicidn, se sabe que, de (7.15) y del teorema 7.6, la 
distribucion de (n - 1 )S 2 /cr es chi-cuadrada con n - 1 grados de libertad. Dado 
que puede demostrarse que X y S' son independientes, del teorema 7.7 se despren- 
de que la distribucion de 


X — fj. 

vbjjL 


!(n - 1 )S 2 /cr : 


(n - I) 


X - /j. cr 
(r/\/n y's 2 


o 



es la t de Student con n - 1 grados de libertad. 


(7.24) 


TABLA 7.3 Comparacion entre los valores cuantiles de las distribuciones t de Student y nor¬ 
mal estandar 


a 

1 1 n, 20 

t| -a. Ml 

?l-u. 40 

0 -u. 50 

C.| 

0.10 

1.325 

1.310 

1.303 

1.299 

1.282 

0.05 

' 1.725 

1.697 

1.684 

1.676 

1.645 

0.01 

2.528 

2.457 

2.423 

2.403 

2.326 
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Ejemplo 7.8 El Departamento de Protecci6n al Medio Ambiente asegura que, para 
un automdvil compacto en particular, el consumo de gasolina en carretera es de un 
galon por cada 45 millas. Una organization independiente de consumidores adquie- 
re uno de estos sutomdviles y lo somete a prueba con el propdsito de verificar la cifra 
proporcionada por el DPMA. El automovil recorrid una distancia de 100 millas en 
25 ocasiones. En cada recorrido se anoto el numero de galones necesarios para reali- 
zar el viaje. Los 25 ensayos, el valor promedio y la desviacidn est&ndar, tuvieron un 
valor de 43.5 y 2.5 millas por galon, respectivamente. Si se supone que el numero de 
millas que se recorre por galdn es una variable aleatoria distribuida normalmente, 
con base en esta prueba £existe alguna razdn para dudar de la varacidad del dato 
proporcionado por el DONA? 

Este problema ilustra algunas de las dificultades practicas que pueden encontrar- 
se al ponerse en pr&ctica la notion de muestra aleatoria. En forma ideal, se debieron 
seleccionar 25 carros de la misma marca, modelo y configuration de mot^r, dc ma- 
nera aleatoria, del mismo proceso de armado, de nrnera que fuese posible conside- 
rar el consumo de combustible como una variable aleatoria. Sin embargo, en este y 
otros, lo anterior representa un costo prohibitive. A pesar de lo anterior, debe deter¬ 
minate la veracidad de la information proporcionada por el DPMA con base en la 
probabilidad. Esto es, si g fuese realmente igual a 45 millas por galdn, iCual es la pro- 
babilidad de que se observe un valor de X no mayor de 43.5 millas por galon, con base 
en una muestra de tamaflo 25 y una estimation de a igual a 2.5? 

De (7.24) puede verse que 

_ * ~ ^ - 4 3-5 - 45 
~ s/y/n ~ 2.5/V25 

= -3 

es un valor de la distribucion t de Student con 24 grados de libertad. De la tabla F del 
apendice se tiene que P(T *£ - 3) < 0.005. Es decir, si el valor verdadero de la me¬ 
dia es 45, la probabilidad de observar un valor de T no mayor de - 3 unidades, es 
menor de 0.005. En cualquier caso, se ha observado algo que tiene una posibilidad 
de ocurrir menos de 5 en 1 000, o p tiene un valor real menor de 45. Para esta si¬ 
tuation es preferible elegir la segunda explication. 


7.7 La distribucion de la diferencia entre dos medias muestrales 

En muchas ocasiones surge la necesidad de comparar las medias de dos distribucio¬ 
nes distintas. Por ejemplo, supongase que se tiene interes en comparar los tiempos 
de duration promedio de las baterias para automovil “48 meses ” de las marcas 
Mears and Sawbuck y J.C. Nickel. Las baterias vendidas por dos comerciantes, de ma- 
nera factible, se producen por companias distintas y se fabrican bajo diferentes espe- 
cificaciones. Para cada una se supondra que existe una distribucion, diferente de la 
otra, que toma en cuenta la duration de las baterias. 
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Sea X una variable aleatoria que representa la duracidn del acumuladbr Mears 
and Sawbuck, en forma que X ~ N(fi x , u). De manera similar, sea Y la correspon- 
diente variable aleatoria para las baterias J.C. Nickel tal que Y — N(fi Yt <j). Nbtese 
que se supone que las varianzas de X y Y son iguales. Se selecciona una muestra alea¬ 
toria de n K baterias de la marca Mears and Sawbuck y una muestra aleatoria de n r 
de la marca J.C. Nickel. Los acumuladores de las dos muestras se someten a la 
misma prueba de duracidn en la que se controlan todos los factores externos identifi- 
cados. Las diferencias observadas para los tiempos de duracion en ambas marcas se 
deben solo a la variabilidad inherente del proceso de fabrication respectivo. El inte- 
res recae en formular una inferencia con respecto a la diferencia fi x ~ Mr entre las 
dos medias desconocidas. 

Un enfoque viable para este problema es formular la inferencia con base en la 
diferencia que hay entre las dos medias muestrales X y Y. De acuerdo con lo ante¬ 
rior, se necesita obtener la distribution de X - Y cuando el muestreo se lleva a cabo 
sobre dos poblaciones normales independientes con varianzas iguales. Si se supone 
que el valor de la varianza a 1 se conoce del teorema 7.3, se sabe que ^distribution 
de X es normal con media fi x y varianza <r 2 /n x . La distribucion de Y tambien es 
normal pero con media n Y y varianza a^/ny. Dado que X y Y son variables alea- 
torias independientes normalmente distribuidas, si n, = 1 y a 2 = - 1 en el teo¬ 
rema 7.2, la distribucion de X - Y tambien es normal con mediae - Mr y va¬ 
rianza ( cr 2 /n x ) + ( cr/rty) — cr : (l/n x + l/n y ). Por lo tanto, si se conoce el valor de 
cr 2 , la distribucidn de 


Z = 


■Y Y (fl X fly) 

r 

<T /— + — 

V n x n Y 


(7.25) 


es N( 0, 1). La expresion (7.25) proporciona un camino adecuado por medio del cual 
se puede formular una inferencia con respecto a la diferencia de las medias poblacio- 
nales de dos distribuciones normales independientes con igual varianza. 

En el desarrollo de (7.25) se supuso que el valor de cr 2 era conocido. Sin embar¬ 
go, es poco probable conocer el valor de cr 2 para una situation real. Asi pues, debe 
obtenerse la distribucion de X — Y cuando el muestreo se lleve a cabo sobre dos 
poblaciones normales independientes con varianzas iguales pero desconocidas. Para 
cada una de las dos muestras aleatorias, pueden definirse las varianzas muestrales 
5^- y S Y dadas por (7.14). Dado que ( n x - D^/tr 2 y (n Y - l)S 2 Y /(r 2 son dos va¬ 
riables independientes chi-cuadrada, con n x - 1 y n Y - 1 grados de libertad 
respectivamente, por el teorema 7.6, la distribucidn de 

w = (n x zJjg x + ( n x zJjj y (7.26) 

cr 2 cr 2 

tambien es chi-cuadrada con n x + n Y - 2 grados de libertad. De la expresion 
(7.19) se desprende el hecho deque el cociente de Zen (7.25) y la raizcuadrada de W 
divida entre sus grados de libertad tiene una distribucidn t de Student con n x + n Y — 2 
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grados de libertad. Esto es, 



en donde 

S 2 P = [(n x - 1 )S 2 X + (n Y - 1 )S\]/(n x + n r - 2) (7.28) 


que, en general, recibe el nombre de estimador combinado (pooled) de la varianza 
comuno- 2 .Notese de (7.28) que S 2 es el promedio, con factores de peso, de las dos 
varianzas muestrales S x y S 2 y , siendo los factores de peso los grados de libertad. De 
acuerdo con lo anterior, se puede formular una inferencia con respecto a la diferen- 
cia entre /i* y n Y con base en (7.27), cuando el muestreo se lleva a cabo sobre dos 
poblaciones cuyas distribuciones son anormales e independientes y en donde las va¬ 
rianzas son iguales pero sus valores no se conocen. 

En este momento es natural que el lector pregunte que pasa si no es posible supo- 
ner que la varianza de las dos distribuciones sea la misma. Si las varianzas cr x y o> 
no son iguales, pero se conocen sus valores, el problema es sencillo. La distribucion de 


X — Y — (H X [ly) 

V n x n r 


(7.29) 


aun es N( 0, 1), por las mismas razones que llevaron a la expresion (7.25). Por otro 
lado, si se desconocen los valores de las varianzas y ademas estos no son iguales, el 
problema es mucho mas complicado y por esta razon no debe emplearse la expresion 
(7.27). En esencia, una situacion como la anterior constituye lo que se conoce como 
el problema de Fisher-Behrens, el cual se encuentra mas alia del alcance de este libro. 
Existen algunas aproximaciones a este problema, una de la cuales puede encontrarse 
en [1], 


7.8 La distribucion F 


De la seccion 7.5, recuerdese que las inferencias con respecto a a 2 cuando se 
muestrea una distribucion normal, se formulan con base en la estadistica (n - 1)S 2 
/o- 2 , la que tiene una distribucion chi-cuadrada con n - 1 grados de libertad. En esta 
seccion se He^arrollara la estadistica apropiada para emplearse en la formulacion de 
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inferencias cop respecto a las varianzas de dos distribuciones normales independien- 
tes con base en las muestras aleatorias de cada una. Por ultimo, se analizara la teoria 
de una distribucidn muy util, la cual se conoce como distribucidn F. 

Supdngase un experimento en que se observan dos variables aleatorias indepen- 
dientes Xy Y, cada una con una distribucidn chi-cuadrada con v x y v 2 grados de li- 
bertad respectivamente. Sea F una variable aleatoria que es funcidn de X y Y, de ma- 
nera tal que \ ' 


X/v x 

Y/v{ 


(7.30) 


Esto es, la variable aleatoria F es el cociente de dos variables aleatorias chi-cuadra¬ 
da, cada una dividida por sus grados de libertad. Lo' anterior lleva al siguiente teorema. 


Teorema 7.8 Sean Xy Y dos variables aleatorias independientes chi-cuadrada 
con i>j y v 2 grados de libertad, respectivamente. La variable aleatoria 


f - W" 

tiene una distribucidn F con una funcidn de densidad de probabilidad dada por 


gif', V,, v 2 Y 


n(»>, + v 2 )/2M' /2 v 2 - n - 
Y\v x I2)Y(v 2 /2) 


-f 


(*M — 2)/2 


(V 2 + V\f) 


- (vi + V2)/1 


f> 0 , 


(7.31) 

para cualquier otro valor 


(La deduccidn de la funcidn de densidad de probabilidad de F es similar a la de la t 
de Student y se deja como ejercicio para el lector.) 


La distribucidn F se caracteriza completamente por los grados de libertad y v 2 . 
Puede demostrarse que el valor esperado es 


E(F ) = v 2 /(v 2 - 2) v 2 > 2, 

y la varianza esta dada por 


Var(F) = 


v\(2v 2 + 2v, — 4) 
j/,(v 2 - 2)\v 2 - 4) 


v 2 > 4. 


(7.32) 

(7.33) 


La distribucidn F tiene asimetria positiva para cualesquiera valores de v\ y v 2 . pero 
esta va disminuyendo conforme y v 2 toman valores cada vez mas grandes. 

En la tabla G del apendice, se encuentran los valores cuantiles f\ „ »tales que 

P(F f ~g(f\Vi,v 2 )df= 1 - a, O^a^l (7.34) 

Jo 

* Se emplea g para denotar la funcidn de densidad y de esta forma evitar cualquier confusidn con res¬ 
pecto al argumento /. 
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para las proporciones acumulativas seleccionadas 1 - ay distintas combinaciones 
de los grados de libertad del numerador v\,-y del denominador v 2 del cociente 
(7.30). Por ejemplo, si ^ r — 5 y v 2 =10, entonces: • :.» • - 

P(F « fo. 90.5..0) = P(F « 2-52) = 0 90, 

‘ /’(F^/o.w.i.io) = P(F^ 3.33) = 0.95, . 

P(F ^f 0 *>xn>) = * 5.64) = 0.99. 

Notese que en la tabla G se encuentran los valores cuantiles /, unicamente para 
a < 0.5. Si se desean los cuantiles del lado izquierdo (es decir, para a > 0.5) es- 
tos pueden encontrarse mediante el siguiente procedimiento: si la variable aleatoria F tie- 
ne una distribucion F con v x y v 2 grados de libertad, entonces la variable F' - l/F 
tambien tiene una distribucion F pero con v 2 y v x grados de libertad. Puede verse 
que lo anterior es cierto, a par'r de (7.30), 


1 _ Yf v, 

xiv i ~ x/ v ; 

Y/v 2 


Si se desean los valores cuantiles para a > 0.5, 

= 1 - a. 


P(F > 1 


F f 

1 J I — ex, i>\ .1*2. 


o 



1 


/. 


— a. v i. vz 


-- a. 


(7.35) 


(7.36) 


Pero l/F = F' ~ F se encuentra distribuida con v 2 y y, grados de libertad. 
Entonces el a-esimo valor cuantil de F’ es tal que 

P(F' = a. (7.37) 

Dado que (7.36) y (7.37) son identicas, se sigue que 

f u.vz.ri 1 !f\ — a . i'i . 

y 

=•//«.»:.n fora >0.5. (7.38) 

Como ejemplo, sea = 8 y v 2 — 12. Entonces 
P(F^foMs.*.n.) = P(E« l//o,9v.:.«) = P(Es 1/3.28) = P(F « 0.305) = 0.05, 


o 


PiP^fo. oi.K.n) = P(E^ l/ZU.iw.) = W* 1/5.67) = «Fs 0.176) = 0.01. 
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Regresando al problema de desarrollar una estadistica apropiada para usarse en 
la formulacion de inferencias con respecto a las varianzas de dos distribuciones nor- 
males independientes, sea X t , X 2 ,X„ y una muestra aleatoria de variables aleato- 
rias independientes y normalmente distribuidas cada una con media y varianza 
cr; Y . Tambiensea Y u Y : . Y„ r un conjunto de ft Y variables aleatorias indepen¬ 

dientes normalmente distribuidas, cada una con media n Y y varianza cr Y .Si sesupo- 
ne que las X y las Y son independientes, las estadisticas 


y 


(n x 1 )S X / (T\ 


(n Y - 1 )S\/ar Y 


son dos variables aleatorias chi-cuadrada independientes con n x - 1 y n Y - 1 gra- 
dos de libertad, respectivamente. Entonces, por el teorema 7.8, se desprende que la 
variable aleatoria 





1 ) 


1 ) 


§x/_ 17 x 
Sy/cr 2 y 


(7.39) 


tiene una distribucion F con n x - I y n Y - 1 grados de libertad. 

Una aplicacion de (7.39) es inmediata si se recuerda el problema general de la sec- 
cion 7.7. Esto es, el formular una inferencia con respecto a la diferencia entre dos 
medias poblacionales ya sea cuando se conocen las varianzas de las poblaciones o 
cuando se supone que se conoce, al menos, el cociente de estas. Una forma factible 
de verificar la validez de esta suposicion es mediante el empleo de (7.39). Si la supo- 
sicidn de que rr 2 x = a] es correcta, la estadistica F dada por (7.39), se reduce a 

F = S\/S\. (7.40) 

Cuando se obtienen los valores de S x y S Y a partir de las muestras y se calcula el 
cociente (7.40), puede concluirse que la hipotesis de varianza iguales es falsa si el valor 
de este cociente es, de manera suficiente, distinto de 1. En otras palabras, si las dos 
varianzas son iguales, la probabilidad de observar un valor de F distinto, de manera 
suficiente, es pequefia. 

Para finalizar, debe notarse que en esta seccion, asi como en las secciones 7.5 y 
7.7, se desarrollo el material que se presento bajo la hipotesis de realizar un 
muestreo aleatorio sobre poblaciones que tienen una distribucion normal. En la rea¬ 
lidad, la hipotesis de normalidad puede o no ser justificable. Sin embargo, desde un 
punto de vista practico, el lector debe darse cuenta que la diferencia entre la distribu¬ 
cion normal y el modelo de probabilidad de la poblacion de interes es inversamente 
proporcional a las tecnicas delineadas para formular inferencias. La afirmacion an¬ 
terior es particularmente cierta cuando se formulan inferencias con respecto a las va¬ 
rianzas cuando se emplean la distribucion chi-cuadrada o la F. 
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Ejercicios 

7.1. Una firma de mercadotecnia envia un cuestionario a 1 000 residentes de cierto suburbio 
de una ciudad para determinar sus preferencias como compradores. De los 1 000 resi¬ 
dentes, 80 responden el cuestionario. j.Lo anterior constituye una muestra aleatoria? 
Discutir los meritos de este procedimiento para obtener una muestra aleatoria. 

7.2. En una planta de armado automotriz se seleccionar&n 50 de los primeros 1 000 automo- 
viles de un nuevo modelo para ser inspeccionados por el departamento de control de ca- 
lidad. El gerente de la planta decide inspeccionar un automovil cada vez que terminan 
de armarse 20. <,Este proceso dara como resultado una muestra aleatoria? Comente. 

7.3. Si X } , X 2 , ..., X n constituye una muestra aleatoria, obtener las funciones de verosimili- 
tud de las siguientes distribuciones: 

a) De Poisson, con parametro X; 

b) Hipergeometrica, con parametro p; 

c) Uniforme en el intervalo (a, b);. 

d) N(p,cr). 

7.4. Repetir el ejercicio 7.3 para las siguientes distribuciones: 

a) Gama con parametro a y Q, 

b) Weibull con parametro a yd. 

7.5. Sea X,, X 2 , ..., X„ una muestra aleatoria de una poblacion cuya distribution es 
normal con media n y varianza a 2 desconocidas. De las siguientes, <,cu&les son esta- 
disticas? 

a) 2Y, - p d) X] + X\ - exp(Af 3 ) 

b) crX, + aX 2 e) XJcr, i = 1,2 . n 

c) X ,, i =1,2 . n f) £(Y, - X) 2 

7.6. Sean X ,, Yt, .... X„ n variables aleatorias independientes de Poisson con parametros 

X,, X 2 , .... X„, respectivamente. Mediante el empleo de la funcion generadora de mo- 
mentos, demostrar que la suma de estas variables tambien es una variable aleatoria de 
Poisson con parametros X, + X, + • + X„. 

7.7. Sean A', y X, dos variables aleatorias independientes de Poisson con parametros X, y 
\, respectivamente. Demostrar que la diferencia entre X, y X 2 no es una variable alea¬ 
toria de Poisson. 

7.8. Sean X, y X ; dos variables aleatorias independientes binomial con parametros n,y p, y 
n : y p, respectivamente. Demostrar que la suma de X, y X z es una variable aleatoria bi¬ 
nomial con parametros n, + n 2 y p. 
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7-9. Sean AYy X 2 dos variables aleatorias independientes distribuidas exponencialmente con 
el mismo parimetro 6. Demostrar que la suma de X\ y X 2 es una variable aleatoria gama 
con par&metro de forma 2 y parametro de escala 0. 

7.10. Para im determinado nivel de ingresos, el Departamento de Hacienda sabe que las canti- 
dades declaradas por concepto de deducciones medicas (A",), contribuciones caritativas 
(X 2 ) y gastos varios (A",), son variables aleatorias independientes normalmente distribui¬ 
das con medias $400, $800 y $100 y desviaciones estandar $100, $250 y $40, respectiva- 
mente. 

a) iCual es la probabilidad de que la cantidad total declarada por concepto de estas tres 
deducciones, no sea mayor de $1 600? 

b) Si una persona con este nivel de ingresos declara por concepto de estas deducciones 
un total de $2 100, ique tan probable es tener una cantidad igual o mayor a este 
monto bajo las condiciones dadas? 

7.11. Una tienda de articulos electricos para el hogar vende tres diferentes marcas de refrige- 
radores. Sean AY, X 2 y A', variables aleatorias las cuales representan el volumen de ventas 
mensual para cada una de las tres marcas de refrigeradores. Si X ,, X 2 y X, son variables 
aleatorias independientes normalmente distribuidas con medias $8 000, $15 0^0 y 
$12 000, y desviaciones estandar $2 000, $5 000 y $3 000, respectivamente, obtener la 
probabilidad de que, para un mes en particular, el volumen de venta total para los tres 
refrigeradores sea mayor de $50 000. 

7.12 En una tienda de servicio el tiempo total del sistema consta de dos componentes (el lap- 
so de tiempo que debe esperarse para que el servicio de comienzo (A',) y el lapso de tiem¬ 
po que este dura (X 2 )). Si A', y X 2 son variables aleatorias independientes exponencial- 
mente distribuidas con un tiempo medio de 4 minutos cada una, £cual es la probabilidad 
de que el tiempo total que tarda el sistema en proporcionar el servicio no sea mayor de 
15 minutos? (Sugerencia: consulte el ejercicio 7.9.) 

7.13. Sea A",, X 2 , .... X„ una muestra aleatoria de una poblacibn que tiene unadistribucibn 
gama con parimetros a y 0. Mediante el uso de la funcion generadora de momentos, 
demostrar que la distribucion de la media muestral A" tambien es de tipo gama, con pa- 
rcimetros de escala y de forma iguales anay 9/n respectivamente. 

7.14. Mediante el empleo de los resultados de la section 5.9, generar numeros aleatorios para 
las distribuciones binomial y exponential y usarlos para demostrar el teorema central del 
limite. De manera esperifica, para n = 10 y n = 40, generar 50 muestras de una distri¬ 
bution binomial con p = 0.4. Repetir el procedimiento anterior generando 50 muestras 
de una distribucion exponencial con parametro 9 = 100. £Se ha demostrado el teorema 
central del limite en un grado razonable? 

7.15. Para cierta prueba de aptitud se sabe con base en la experiencia que el numero de acier- 
tos es 1 000 con una desviacion estandar de 125. Si se aplica la prueba a 100 personas se- 
leccionadas al azar, aproximar las siguientes probabilidades que involucran a la media 
muestral X. 

a) P (985 < X < 1015) c) P(X > 1020) 

b) P (960 < X < 1040) d) P{X < 975) 

7.16. Un contratista piensa comprar una gran cantidad de lamparas de alta intensidad a cierto 
fabricante. Este asegura al contratista que la duracion promedio de lets lamparas es de 
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1 000 horas con una desviacidn estitndar igual a 80 horas. El contratista decide comprar 
las limparas s61o si una muestra aleatoria de 64 de estas da como resultado una vida 
promedio de por lo menos 1 000 horas. <,Cual es la probabilidad de que el contratista 
adquiera las lam paras? 

7.17. Un inspector federal de pesos y medidas visita una planta de empacado para verificar 
que el peso neto de las cajas sea el indicado en estas. El gerente de la planta asegura al 
inspector que d peso promedio de cada caja es de 750 gr con uiia desviacidn estiindar 
de 5 gr. El inspector selecciona, al azar, 100 cajas y encuentra que el peso promedio 
es de 748 gr. Bajo estas condiciones, <,que tan probable es tener un peso de 748 o me¬ 
nos? iQue actitud debe tomar el inspector? 

7.18. En la fabrication de cojinetes para motores, se sabe que el diametro promedio es de 5 
cm con una desviacion est&ndar igual a 0.005 cm. El proceso es vigilado en forma perio¬ 
dica mediante la seleccidn aleatoria de 64 cojinetes, midiendo sus correspondientes 
diSmetros. El proceso no se detiene mientras la probabilidad de que la media muestral se 
encuentre entre dos Umites especificados sea de 0.95. Determinar el valor de estos Hmites. 

7.19. En la produccidn de cierto material para soldar se sabe que la desviacidn est&ndar de la 
tension de ruptura de este material es de 25 libras. iCual debe ser la tension de ruptura 
promedio del proceso si, con base en una muestra aleatoria de 50 especimenes, la proba¬ 
bilidad de que la media muestral tenga un valor mayor de 250 libras es de 0.95? 

7.20. Genere 50 muestras, cada una de tamaflo 25 a partir de una distribucion normal con me¬ 
dia 60 y desviacidn est&ndar 10. Calcule la varianza de cada muestra mediante el empleo 
de (7.14). 

a) Obtener la media y la varianza de .S'’ mediante el empleo de los 50 valores calculados. 
iComo son estos valores al compararlos con los proporcionados por las expresiones 
(7.17) y (7.18)? 

b) Agrupar los 50 valores calculados de S 2 y graficar las frecuencias relativas. Comentese 
sobre los resultados. 

7.21. Repetir el ejercicio 7.20 pero generando los valores aleatorios a partir de una distribu- 
cion exponencial con parametro de escala 9 = 30. Haga un comentario sobre sus resul¬ 
tados. 

7.22. Para un gerente de planta es muy importante controlar la variacion en el espesor de un 
material plastico. Se sabe que la distribucion del espesor del material es normal con una 
desviacidn estandar de 0.01 cm. Una muestra aleatoria de 25 piezas de este material da 
como resultado una desviacidn estandar muestral de 0.015 cm. Si la varianza de la 
poblacion es (0.01) : cnr, £cual es la probabilidad de que la varianza muestral sea igual 
o mayor que (0.015) : cm'? Por lo tanto, £que puede usted concluir con respecto a la va¬ 
riation de este proceso? 

7.23. Si se obtiene una muestra aleatoria de : n = 16 de una distribucion normal con media y 

varianza desconocidas, obtener P(5 : /o- : 2.041). 

7.24. Si se obtiene una muestra aleatoria de tamano n = 21 de una distribucion normal con 
media y varianza desconocidas, obtener P(S~/<r « 1.421). 

7.25. Un fabricante de cigarrillos asegura que el contenido promedio de nicotina, en una de 
sus marcas, es de 0.6 mg por cigarrillo. Una organization independiente mide el conteni¬ 
do de nicotina de 16 cigarrillos de esta marca y encuentra que el promedio y la desvia- 
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cion estandar muestral es de 0.75 y 0.175 mg, respectivamente, de nicotina. Sise supone 
que la cantidad de nicotina en estos cigarrillos es una variable aleatoria normal, ique 
tan probable es el resultado muestral dado e} dato proporcionado por el fabricante? > 

7.26. Durante los 12 meses pasados el volumen diario de ventas de un restaurante fue de 
$2 000. El gerente piensa que los prbximos 25 dias seran tipicos con respecto al volumen 
de ventas normal. Al finalizar los 25 dias, el volumen de ventas y su desviacion estandar 
promedio fueron de $1 800 y $200, respectivamente. Sup6ngase que el volumen de ven¬ 
tas diario es una variables aleatoria normal. Si usted fuese el gerente, £tendria alguna ra¬ 
zbn para creer, con base en este resultado, que hubo una diminution en el volumen de 
ventas promedio diario? 

7.27. El gerente de una refineria piensa modificar el proceso para producir gasolina a partir 
de petroleo crudo. El gerente hara la modification solo si la gasolina promedio que se 
obtiene por este nuevo proceso (expresada como un porcentaje del crudo) aumenta su 
valor con respecto al proceso en uso. Con base en un experimento de laboratorio y me- 
diante el empleo de dos muestras aleatorias de 'anr^o 12, una para cada proceso, la 
cantidad de gasolina promedio del proceso en uso es de 24.6 con una desviacion est&n- 
dar de 2.3, y para el proceso propuesto fue de 28.2 con una desviacion estandar de 2.7. 
El gerente piensa que los resultados proporcionados por los dos procesos son variables 
aleatorias independientes normalmente distribuidas con varianzas iguales. Con base en 
esta evidencia, idebe adoptarse el nuevo proceso? 

7.28. Una organization independiente esta interesada en probar la distancia de frenado a una 
velocidad de 50 mph para dos marcas distintas de automoviles. Para la primera marca 
se seleccionaron nueve automoviles y se probaron en un medio controlado. La media 
muestral y la desviacibn est&ndar fueron de 145 pies y 8 pies, respectivamente. Para la se- 
gunda marca se seleccionaron 12 autombviies y la distancia promedio resulto ser de 132 pies 
y una desviacion estiuidar de 10 pies. Con base en esta evidencia, ^existe alguna razbn para 
creer que la distancia de frenado para ambas marcas, es la misma? Supongase que las 
distancias de frenado son variables aleatorias independientes normalmente distribuidas 
con varianzas iguales. 

7.29. La variacibn en el numero de unidades diarias de cierto producto, el cual manejan 
dos operadores A y B, debe ser la misma. Con base en muestras de tamafio n A = 16 
dias y n B = 21 dias, el valor calculado de las desviaciones est&ndar muestrales es de 

= 8.2 unidades y s B — 5.8 unidades. Si el numero de estas, manejadas por los dos 
operadores, por dia, son dos variables aleatorias independientes que se encuentran 
aproximadas, en forma adecuada, por distribuciones normales, ^existe alguna ra¬ 
zbn para creer que las varianzas son iguales? 

7.30. Con base en la informacion proporcionada en el ejercicio 7.27, iexiste alguna razbn 
para creer que las varianzas de los dos procesos son iguales? 


APENDICE 

Demostracion del teorema central del limite 

El proposito de este apendice no es el presentar una demostracion general y elegante 
desde el punto de vista matematico, sino mas bien proporcionar un esbozo de la de- 
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mostraci 6 n del teorema central del limite. Se quiere demostrar que la funcidn gene- 
radora de momentos de (A' — (i)/ (a/\Jn) tiende a la de una distribution normal 
estandar conforme n tiende al infinito. Sean ~ 

Z, = ( X t - fi)/cr i = 1, 2, n. 


X - n 

v/Vn 


Dado que 


l i(*Tr) = -—7=2^ - M ) - ---ttwc - = Zjf, 

n ,= i\<r/\/n/ n a/\Jrii=\ « o'/V /1 <r/V« 


entonces 

l " 
yn ,> i 

Como resultado se tiene que la funcion generadora de momentos de Y es igual a la 
funcion generadora de momentos de (l/\/n) S" = , Z,. Del teorema 7.1, 

m Y (t) = [m Zl (t/\/n)] n 

= {£[e xp(/Z,/\/n)]}", 

dado que las Z, son variables aleatorias independientes. 

Al expander (tZ,/\/70 en una serie de Taylor: 

— t t 2 t* 

exp UZi/y/n) = 1 + ~~=Z, + —Z) + -— 57 ^ + ••• . 

\Jn 2n V.n' 

Si se toman los valores esperados y se recuerda que £(Z,) = 0 y Var(Z t ) = 1, / = 
1 , 2 , n, se tiene 

£[exp(/Z,/V«)] = 1 + £ + 7^175 £(Z, 3 ) + - . 

in 5\n ' 

De acuerdo con lo anterior 


niyU) - 1 + Yn + 3!^ £(Z ' ) + 


i r .3 

1 + - - + -~ r E(Z]) + 
n\_2 3 ! y/n 


= 1 + 


www. FreeLibros. com 



Apindice 249 


en donde 


Ahora 


pero por definition 


W= 2 + 


V.\fn 


E(Zf) + 


lim m r (t) 




1 


+ 



e 


u 


Lo anterior da como resultado una situation identica a la que se tiene en la de- 
mostracion del teorema 5.1. Esto es, conforme todos los terminos en u, ex- 

cepto el primero, tienden hacia cero debido a que todos tienen potencias posidvas de 
n en sus denominadores. Por lo tamo, puede deducirse que 

lim m Y (t) = exp(/ 2 /2), 

n—*x 

o la distribution limite de Y = (X - p)/(o-/\/n) es la normal estandar para valo- 
res grandes de n. 


APENDICE 

Deduction de la funcion de densidad de probabilidad t de Student 

Sea T una variable aleatoria definida por (7.19). Considere la densidad de probabili¬ 
dad de T cuando X se mantiene fija en un valor x. Dado que 

fAz) = —^=exp(-z 2 /2), 

ylrr 

la densidad de probabilidad condicional de 

T = Z/(x/ v f 2 

se obtiene al considerar la relation inversa 

Z =(x/v)' n T 

y al sustituir en fAz). en donde el jacobiano de la transformacion es 
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De esta forma 

f(t\ x ) = lfZ^j ' /2 exp( -xt 2 /2v), -oo < t <c c, x > 0. 
\J2tt 

De (6.19) se sabe que la densidad conjunta de T y X es 

fO, X) = f{t\x)f x (x). 

Dado que X ~ X 2 , 


De esta forma 


fx(x) = 


/(/. X) = 


2 v/1 r(v/2) 


I 


x ( *" 2,/2 exp(-x/2), x > 0. 


x"" l,/2 exp 


x xi “ 
2 ~ ~ 2 v 


y/2i tv T n Y(v/2) 

- C|X , *' -h/2 exp(-csx/2), 

en donde c, = \/Y\/2irv 2" n Y(v/2)] y q = [I + (r/r-)]. Integrando/(/, x) con 
respecto ax, se obtiene la funcion de densidad de probabilidad de la distribution t de 
Student. De acuerdo con lo anterior 

frU) = c, x (,,_l)/2 exp( - c 2 x/2)dx 

= c, [ (2y/c 2 ) l “~'' >/2 exp( -y)(2/c 2 )dy, en donde y = c 2 x/2y dx = (2/c 2 )dy 
Jo 


= c,(2/c 2 )' 


. \(v+ I )/2 


r (»-'»/ 2 ( 

Jo 


exp (-y)dy 


= c 1 (2/c 2 )“' +,,/2 r[(«. + l)/2] 

j 2^+ • )/2 


\Z2irv2- n Y(v/2) [I + ('7 *')]"' 


+ D/2] 


ru* + i)/2j 


\/TTP T(v/2) L 


1 + (t 1 / v) 


-(»+ l>/2 


— X < / < 0C. 
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CAPITULO OCHO 

' j \ - ~ 77 : r -v r-* " 

Estimacion puntual 
y por intervalo 


8.1 lntroducci6n 

En el capitulo anterior se menciono, en forma breve, que las estadlsticas se emplean 
para estimar los valores de parametros desconocidos o funciones de estos. En este 
capitulo se examinarS con detalle el concepto de estimacidn de pardmetros mediante 
la especificacidn de las propiedades deseables de los estimadores (estadlsticas) y el 
desarrollo de tecnicas apropiadas para implementar el proceso de estimacidn. Seuti- 
lizara el punto de vista de la teoria del muestreo, que considera a un par&metro como 
una cantidad fija pero desconocida. 

La estimacion de un parametro involucra el uso de los datos muestrales en con- 
juncion con alguna estadistica. Existen dos formas de llevar a cabo lo anterior: la es¬ 
timacion puntual y la estimacidn por intervalo. En la primera se busca un estimador 
que, con base en los datos muestrales, de origen a una estimacion univaluada del va¬ 
lor del par&metro y que recibe el nombre de estimado puntual. Para la segunda, se 
determina un intervalo en el que, en forma probable, se encuentra el valor del para¬ 
metro. Este intervalo recibe el nombre de intervalo de confianza estimado. 

A1 igual que en los capitulos anteriores, la funcion de densidad de probabilidad 
en la distribucion de la poblacion de interes se denotara por /f.r; 0). donde la funcion 
depende de un parametro arbitrario 0. el cual puede tomar cualquier valor que se 
encuentre en cierto dominio.* De esta forma, el principal objetivo de este capitulo es 
presentar los criterios convenientes para la determinacion de los estimadores de 6. 


8.2 Propiedades deseables de los estimadores puntuales 

Con el proposito de mostrar la necesidad de estimar parametros, considerese la si- 
guiente situacion. Cuando se obtiene una muestra aleatoria de cierta caracteristica X 


El dominio de un parametro recibe el nombre de espatio parametral. 
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de la distribution de la poblacion, y a pesar de que pueda identificarse la fonna fun- 
cional de la densidad de esta, es poco probable que la caracteristica pueda espedfi- 
carse de manera completa mediante los valores de todos los parfunetros. En esencia, 
se conoce la familia de distribudones a partir de la cual se obtiene la muestra, pero 
no puede identificarse el miembro de interes de esta, ya que no se conoce el valor del 
parametro. Este ultimo tiene que estimafse con base en los datos de la muestra. Por 
ejemplo, supongase que la distribudbn del tiempo de servido en una tienda es expo- 
nendal con parametro desconocido 0. Se observan 25 lapsos aleatorios y la media 
muestral calculada es igual a 3.5 minutos. Dado que para la distribucin exponendal 
E(X) = 0, un estimado puntual de 0 es 3.5. Por lo tanto, de manera aparente, el 
muestreo se llevo a cabo sobre una distribucion exponendal cuya media estimada es 
de 3.5 minutos. 

Es posible deflnir muchas estadisticas para estimar un parametro desconoddo 6. 
Por ejemplo, para el caso anterior pudo elegirse la mediana muestral para estimar el 
valoi de la media. Entonces, £c6mo seleccionar un buen estimador de 01 iCuales 
son los criterios para juzgar cu&ndo un estimador de 0 es “bueno” o “malo”? De 
manera intuitiva, ique es un buen estimador? Si se piensa en terminos de “estima- 
dores humanos” como los que se encuentran en las compaflias grandes de construc¬ 
tion, entonces quiza un buen estimador sea aquella persona cuyas estimaciones 
siempre se encuentran muy cercanas a la realidad. Como ejemplo adicional, suponga 
que un grupo de personas se encuentra al tanto del volumen de ventas y adquisi- 
ciones de tres comerciantes (A, ByC) quienes compiten en el mismo mercado. 
Como el inventario es siempre un aspecto importante en los negocios, cada uno de 
estos comerciantes predice la demanda mensual de sus productos y, con base en esta, 
realizan las adquisiciones necesarias. Supongase que se determina la diferencia entre 
las demandas real y la esperada para varios meses y con base en estas se obtienen las 
distribudones de frecuencia que se muestran en la figura 8.1. 



F1GURA 8.1 Frecuencias alisadas para la diferencia entre las demandas real y predecida 
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La intuicipn sugiere que el comerciante C es el que hace mejor su trabajo no s61o 
porque la distribucion de la diferencia entre las demandas real y esperada se con- 
centra alrededor del valor perfecto de cero sino tambien porque la variabilidad de la 
diferencia es, en forma relativa, pequefta. Para el comerciante A* aun a pesar de que 
la distribucion tambien se encuentra centrada alrededor del origen, existe una mayor 
variabilidad en las diferencias. La distribudOn para el comerdante B sc concentre 
alrededor de un valor negativo, lo cual sugiere que B sobreestima la mayor parte del 
tiempo la demanda mensual. 

Si se acepta la premisa de que el objetivo de la estimacion de parametros no es 
igual al de los estimadores o predictores humanos, entonces, de los ejemplos ante- 
riores, surgen dos propiedades deseables: el estimador de un parametro 9 debe tener 
una distribucion de muestreo concentrada alrededor de 9 y la varianza del estima¬ 
dor debe ser la menor posible. 

Para ampliar las propiedades anteriores, considerese lo siguiente. Sea X u X 2 . X„ 

una muestra aleatoria de tamaflo n proveniente de una distribution con funcibn 
de densidad fix; 9), y sea T = u(X t , X 2 , ■ , X „) cualquier estadistica. El proble- 
ma es encontrar una funcion u que sea la que proporcione la “mejor” estimacion de 
0. Al buscar el mejor estimador de d se hara uso de una cantidad muy importante 
que recibe el nombre de error cuadratico medio de un estimador. 

Definicion 8.1 Sea T cualquier estimador de un parametro desconocido 9. Se defi¬ 
ne el error cuadratico medio de T como el valor esperado del cuadrado de la dife¬ 
rencia entre T y 9. 

Para cualquier estadistica T, se denotara el error cuadratico medio por ECM(7); 
de esta forma 


ECM (T) = E(T - 9) 2 . (8.1) 

Puede verse la razon del por que el error cuadratico medio es una cantidad im¬ 
portante para enjuiciar a los posibles estimadores de 9 mediante el desarrollo de 
(8.1); este es, 

ECM(T) = E(T 2 - 29T + 0 2 ) 

= E(T 2 ) - 2$E(T) + 9 2 

= VariT) + [£(T)] 2 - 29 XT) i- 9 2 

= VariT) + [9 - E(T)} 2 . (8.2) 

El error cuadratico medio de cualquier estimador es la suma de dos cantidades no 
negativas: una es la varianza del estimador y la otra es el cuadrado del sesgo del esti¬ 
mador. El lector encontrara que estas dos cantidades se encuentran relacionadas en 
forma directa con las propiedades deseables de un estimador. De manera especifica, la 
varianza de un estimador debe ser lo mas pequena posible mientras que la distribu¬ 
cion de muestreo debe concentrarse alrededor del valor del parametro. Por lo tanto, 
el problema visto de manera superficial parece bastante sencillo; esto es, seleccionar, 
como el mejor estimador de 9, la estadistica que tenga el error cuadratico medio 
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mas pequeflo posible de entre todos los estimadores factibles de 6. Sin embargo, en 
realidad el problema es mucho mas complicado. Aun si fuese practico determinar 
los errores cuadraticos medios de un numero grande de estimadores, para la mayor 
parte de las densidades f(x\ 0) no existe ningun estimador que minimice el error 
cuadratico medio para todos los posibles valores de 9. Es decir, un estimador puede 
tener un error cuadratico medio minimo para algunos valores de 9 r mientras que 
otro estimador tendrb la misma propiedad, pero para otros valores de 0. 

Ejemplo 8.1 Sea A 1 ,, X 2 , X„ una muestra aleatoria de alguna distribucibn tal 
que E(Xi) = p y Var{X t ) = cr 2 , i - 1, 2, n. Considere las estadisticas 

J, = X 


y 


T 2 = S X:/(n + 1) 


/= i 


como posibles estimadores de p. Obtener los errores cuadraticos medios de T x y T 2 y 
demostrar que ECM(7’ 2 ) < ECM(7,) para algunos valores de p mientras que la pro- 
posicibn inversa es cierta para otros valores de p. 

El sesgo de T l es cero, dado que £(7’,) = E(X) = p: de esta forma se tiene 

ECM(7,) = Var(T ,) = a 2 /n. 

Para T 2 , 


E(T 2 ) = (n + ir‘£ X 


= (« + ir'E Eix,) 


De manera similar, 


np/(n + 1). 


Var(T 2 ) = Var 


(n + 1) '2 Xi 


/= i 


De esta forma se tiene 


= (n + I)' 2 2 VariX,) 

/= J 

= n<r 2 /(n + l) 2 . 


ECM (T 2 ) = 


no ■■ 


(n + 1) J 

na 2 + p 2 
(n + l) 2 


i + 


P 


np 


(// + I) 
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Si n = 10 y cr 2 = 100; entonces < « 

f ECM(7,) = 10, 

y > •< ■ r- 

* • ' ECM(7 2 ) = (1000 + p 2 )/121. .-iJ'-' 

A1 igualar las dos expresiones anteriores y resolver para p, se tiene que para p < 
V^IO, ECM(7 2 ) < ECM(7,); pero si p >\\/210, entonces ECM(7,) < ECM(7 2 ). 

Es por esta razon que se deben examinar criterios adicionales para la selection de 
los estimadores de 9, aun a pesar de que el error cuadratico medio sea el concepto 
m&s importante. De manera especifica se estudiaran los estimadores insesgados, 
consistentes, insesgado de varianza minima y eficientes. Entonces, con base en lo an¬ 
terior, se presentara un concepto importante en la estimation puntual que se conoce 
como estadisticas suficientes. A lo largo de toda la discusi6n se supodr& la existencia 
de un solo parametro desconocido. Sin embargo, debe notarse que bajo condiciones 
mas generales estos conceptos pueden extenderse para incluir un numero mayor de 
parametros desconocidos. 


8.2.1 Estimadores insesgados 

En el error cuadratico medio de un estimador 7, el termino [9 - £(7)] recibe el 
nombre de sesgo del estimador. El sesgo de 7 puede ser positivo, negativo o cero. 
Puesto que el cuadrado del sesgo es un componente del error cuadratico medio, es ra- 
zonable insistir que este sea, en valor absoluto, lo mas pequefio posible. En otras pa- 
labras, es deseable que un estimador tenga una media igual a la del parametro que se 
esta estimando. Lo anterior da origen a la siguiente definicion. 

Definicion 8.2 Se dice que la estadistica 7 = n{X ,, X 2 ,..., X„) es un estimador in¬ 
sesgado del parametro d, si E(T) = 9 para todos los posibles valores de 9. De esta 
forma, para cualquier estimador insesgado de 0, la distribucion de muestreo de 7se 
encuentra centrada alrededor de 9 y ECM(7) = Var(T). 

En la seccion 7.4 se demostro que, sin importar la distribucion de la poblacion de 
interes, £( X ) = p. Por lo tanto, la media muestral es un estimador insesgado de la 

media de la poblacion p para todos los valores de p. De hecho, si A",, X : .A',, es 

una muestra aleatoria de la distribucibn de X con media p. entonces cualquier X j de la 

muestra un estimador insesgado de ft, dado que E(X^) = p para toda / = 1,2. n. 

Ademas, si una estadistica 7es cualquier combinacibn lineal de las variables aleato- 
rias de la muestra de manera tal que 

7 = OiA'i + CI 2 X 2 + ••• + a n X n 

en donde , a, = i, entonces 7 es un estimador insesgado de p dado que 

E(T) = E(ii\X , + CI 2 X 2 + + a„X„) 

i = a t p + a 2 p + ••• + a„p 

= P- 
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En la secci6n 7.5 se demostro que si la varianza muestral S 2 estb dada por (7.14), 
entonces, cuando se muestrea una distribuci6n normal, E(S 2 ) = a 2 . A continua- 
ci6n se demostrarb que si S 2 esUt definida por (7.14), entonces este es un estimador 
insesgado de cr 2 sin importar cual sea la distribuci6n de la poblacibn de interes. Sea 
A',, X 2 , X„ una muestra aleatoria de alguna distribucion con una funcibn de 
densidad na especificada. De esta manera, E(Xj ) = p y VariXj) = cr 2 para toda 
i = 1, 2. n. 


Entonces 


E(S 2 ) = E 


2 (X, - X) 2 /(n - 1) 


Li= i 


= (n - 1 Y'E 


n 

S K*, - ii) ~ (X - m)] 2 


= (n - ir'£ 



[(Xi - M) 2 - n(X - M) 2 ] 


= (n - D 


- I 


2 E(X i - pf - nE(X - M ) 2 


L> = i 


pero por definicion E(X S - p.) 2 = Var(X,) = cr 2 y E(X - p) 2 = Var(X) = <j 2 /n. 
Por lo tanto 

E{S 2 ) = (n - l)' 1 [ncr 2 - (na 2 )/n] 

= <j 2 (n - 1) 
n - 1 

= cr 2 . 

En otras palabras, S 2 es un estimador insesgado de cr 2 solo cuando el divisor es 
igual a n -1 . Esta es la razon del por que al determinar la varianza muestral se divide 
por n - 1 en lugar de dividir por n. El lector debe saber que este resultado no hara de 
S un estimador insesgado de cr (vease la seccion 11.2.2).* 


8.2.2 Estimadores consistentes 

Es razonable esperar que un buen estimador de un parametro 0 sea cada vez mejor 
conforme crece el tamaflo de la muestra. Esto es, conforme la informacion en una 
muestra aleatoria se vuelve mas completa, la distribucion de muestreo de un buen es¬ 
timador se encuentra cada vez mas concentrada alrededor del parametro 0. Se 
tendril un mejor estimador de 0 si se basa en 30 observaciones que si lo hace con 
solo cinco. Esta idea origina lo que se conoce como un estimador consistente. 


Definicion 8.3 Sea Tel estimador de un parametro 0, ysea 7j, 7\. T„ unase- 

cuencia de estimadores que representan a T con base en muestras de tamaflo 1,2... 

* Vea«e pi material que lleva a la expresion (7.15) 
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n, respectivamente. Se dice que T es un estimador consistente (sencillo)* para 0 si 

lim P(\T n - 0|<e) =1 : v > : v ^ 

para todos los valores de 0 y e > 0. 

El requisito de que Um n _, P(\T„ - 6\ e) = J para toda 0 constituye lo que se 
denomina convergence en probabilidad. Es decir, si un estimador es consistente, 
converge en probabilidad al valor del parSunetro que est4 intentando estimar confor- 
me el tamaiio de la muestra crece. Esto implica que la varianza de un estimador consis¬ 
tente T„ disminuye conforme n crece, y la media de T„ tiende hacia donde n crece. 
De esta forma, las condiciones que T n debe cumplir para ser un estimador insesgado 
de 6 y para que Var(T„)—>0 conforme son suficientes (pero no necesarias) 
para que exista consistencia. Por ejemplo, la media muestral X y la varianza 
muestral S 2 j>on estimadores consistentes de m y cr 2 , respectivamente. Para de- 
mostrar que A' es un estin.adc. consistente de p. primero se enunciar^ un impor 
tante 'eorema conocido como desigualdad de Tchebysheff. 

Teorema 8.1 Sea X una variable aleatoria con una funcion (densidad) de probabili- 
dad f(x) de manera tal que tanto E(X) = /a como Var(X) = cr 2 tienen un valor fi- 
nito. Entonces 

P(\x - i - P 

o 

P( \x - At] > ka) « p 

para cualquier constante k 5= 1. (Para la demostracion de este teorema vease [3].) 

La desigualdad de Tchebysheff es muy importante, ya que permite determinar 
los limites de las probabilidades de variables aleatorias discretas o continuas sin te- 
ner que especificar sus funciones (densidades) de probabilidad. Este teorema de 
Tchebysheff asegura que la probabilidad de que una variable aleatoria se aleje no 
mas de k desviaciones estandar de la media, es menor o igual a 1/A: 2 para algun valor 
de A 5= 1. Por ejemplo 

P(\X - M | ^ 2a) 5* 1 - i 

4 

y 

P{\x ~ Ml « 3o-) 5= 1 - i 

para cualquier variable aleatoria X con media p. y varianza o- 2 finitas. 


* Tambien puede definirse un estimador de error cuadratico consistente en forma tal que 

lirnffr, - 6 )"’ = 0, para toda 0, 


pero la idea de consistencia sencilla es una propiedad mis basica. 
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Para demostrar que la media muestral X n , como funci6ri de una muestra alea- 
toria de tamafio n, es un estimador consistente de p, se utilizara el resultado propor- 
cionado por el teorema 8.1. i * , 

Teorema 8.2 Sean X u X 2 , ..., X„ n variables aleatorias IID, tales que £'(A’,)^ = p 
y Var(Xi) = cr 2 tienen un valor finito para / = 1, 2, n. Entonces X„ - 
E" = , Xj/n es un estimador consistente de p. 

Demostracidn: Se quiere demostrar que 

lim P{\X n - /4 « e) = 1. 

n — 

Dado que X„ es una variable aleatoria tal que E{X„) = p y Var{X„) = a 2 /n, se 
deduce del teorema de Tchebysheff que 

P(\X„ - /z|> kcr/yjn) « 1 Ik 1 . 

Sea k una constante positiva igual a e\/n/a, en donde e es un numero real positivo. 
Entonces 

P(\X n - p\>e)^^ 2 . 

Dado que <t 2 tiene un valor finito, tomando el limite de esta expresion conforme n 
tiende al infinito se tiene 

lim P(\X n - /u.| > e) = 0. 

n —►’c 

Por lo tanto, se concluye que 

lim P(\X n - p\^e) = 1, 

y X n es un estimador consistente de p. 

El teorema 8.2 tambien se conoce como la ley de los grandes numeros. Esta pro- 
porciona el fundamento teorico para estimar la media de la distribucion de la pobla- 
cion con base en el promedio de un numero finito de observaciones de manera tal 
que la confiabilidad de este promedio es mejor que la de cualquiera de las observa¬ 
ciones. Lo anterior permite determinar el tamaflo necesario de la muestra para ase- 
gurar con determinada probabilidad que la media muestral no se alejara mas alia de 
una cantidad especifica de la media de la poblacibn. 

Ejemplo 8.2 Considere el proceso de seleccion de una muestra aleatoria de alguna 
distribucion que tiene una varianza conocida de a 2 = 10 pero con una media p 
desconocida. iCual debe ser el tamafio de la muestra para que la media X„ se en- 
cuentre dentro de un intervalo igual a dos unidades, de la media poblacional con una 
probabilidad de, por lo menos, 0.9? 

Primero se desarrollara una expresion general para n . Del teorema 8.1, se sabe 
que 
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P(\X„ - p\ « kcr/\Jri) 5 = 1 - • 

A: 

Elijase un numero positivo a de manera tal que a = 1 /k 2 ; o k: 
de necesariamente 0 < a < 1 . Entonces - - •* • • - i •' ! 


> ' ;.';i • r. 

. 5iJQ (8-3) 


l/Vcr, en don- 


/ > (|A'„ - /z| o-/V««) > 1 - a. 



Sea e > 0 la magnitud del maximo error permisible entre X„ y /x con base en una 
muestra de tamaflo/i. Entonces 


Resolviendo para n, se tiene 



n 



(8.5) 


( 8 . 6 ) 


Es claro que a = 0.1 y e = 2 para determinar los valores de n. Sustituyendo 
en (8.6), se tiene 


n = 10/(0.1)(4) 
= 25; 


de esta manera, si se selecciona una muestra que contenga por lo menos 25 observa- 
ciones de la distribucion, el valor de la media se encontrara dentro de un intervalo 
con longitud de dos unidades con respecto a la media poblacional que tenga una pro- 
babilidad no menor que 0.9. El valor de probabilidad 0.9 asociado con esta afirma- 
cion en una medida de la confiabilidad con que se puede formular una inferencia 
respecto a/*y con base en A'. 


8.2.3 Estimadores insesgados de varianza minima 

Para un parametro que posee un error cuadratico medio minimo es dificil determi¬ 
nar un estimador para todos los posibles valores del parametro. Sin embargo, es po- 
sible analizar cierta clase de estimadores y dentro de esta clase intentar determinar 
uno que tenga un error cuadratico medio minimo. Por ejemplo, considerese la clase 
de estimadores insesgados para el par&metro 0. Si una estadistica T se encuentra 
dentro de esta clase, entonces E(T) = By ECM (7) = Var(T). Puesto que es desea- 
ble que la varianza de un estimador sea lo m4s pequefia posible, debe buscarse uno 
en la clase de estimadores insesgados, si es que este existe, que tenga una varianza 
minima para todos los valores posibles de 6. Este estimador recibe el nombre de esti¬ 
mador insesgado de varianza minima uniforme (VMU) de 0. La definicion formal 
de un estimador VMU es la siguiente. 

Definicion 8.4 Sea X, , A\ . X„ una muestra aleatoria de una distribucion cuya 

funcion (densidad) de probabilidad es/(.r; 6). Sea la estadistica 7 = //(A,, . 

X„) un estimador de 0 tal que E(T) - By Var(T) es menor que la varianza de 
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cualquier otro estimador insesgado deft para todos los posibles valores deft. Se dice 
entonces que T es un estimador insesgado de varianza minima de ft. 


La varianza de un estimador insesgado es la cantidad mbs importante para decidir 
que tan bueno es el estimador para estimar un par&metro ft. Por ejemplo, sean T t y 
T 2 cualesquiera dos estimadores insesgados de ft. Se dice que T, es un estimador mfe 
eficiente de ft que T 2 si Var(T ,) =; Var(T 2 ), cumpliendose la desigualdad en el sen- 
tido estricto para algun valor de ft. Es muy comun utilizar el cociente Var(T t )/Var 
(T 2 ) para determinar la eficiencia relativa de T 2 con respecto a T y Si los estimadores 
son sesgados, se emplean sus errores cuadraticos medios para determinar las eficien- 
cias relativas. 

6 Como obtener un estimador VMU, si es que fete existe? En muchos casos resul- 
ta prohibitive determinar las varianzas de todos los estimadores insesgados de ft y 
entonces se seleceiona el estimador que tenga la varianza mas pequefia. La busqueda 
de un estimador VMU se facilita bastante con la ayuda de un resultado que recibe el 
nombre de cota inferior de Cramer-Rao, el cual se presenta en el sijuiente teorema. 
Para una demostrpeion de fete y otros detalles que incluyen algunas condiciones de 
regularidad, se invita al lector a que consulte [2]. 


Teorema. 8.3 Sea X,, X 2 . X„ una muestra aleatoria de una distribution con 

una funcibn (densidad) de probabilidad f(x; ft). Si T es un estimador insesgado de 
ft, entortces la varianza de T debe satisfacer la siguiente desigualdad 


VaifT ) 2* 



1 

^ln/CT; 6) J 


( 8 . 7 ) 


El teorema 8.3 establece un limite inferior para la varianza de un estimador de ft. 
Sin embargo, lo anterior no necesariamente implica que la varianza de un estimador 
VMU de ft tenga que ser igual al limite inferior de Cramer-Rao. En otras palabras, 
es posible encontrar un estimador insesgado de ft que tenga la varianza mas pequefia 
posible de entre todos los estimadores insesgados de ft, pero cuyas varianzas son mas 
grandes que el limite inferior de Cramer-Rao. Un estimador de esta clase sigue sien- 
do un estimador VMU de ft. Para un estimador insesgado cuya varianza se apega a 
la cota inferior de Cramer-Rao, se tiene la siguiente definition. 



Definition 8.5 Si T es cualquier estimador insesgado del parametro ft tal que 


Var(T) = 


^ln/LV; ft) j~ 


entonces se dice que T es un estimador eficiente de ft. 

De esta forma, el estimador eficiente de ft es el estimador VMU cuya varianza es 
igual al limite inferior de Cramer-Rao. El estimador eficiente de ft, si es que se puede 
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encontrar, es el mejor estimador (insesgado) de 0 en el contexto de la inferenda es- 
tadisticaclasica. & • - . ;*> .-/vro 

Ejemplo 8.3 Sea, X u X 2 , .... X„ una muestra aleatoria de una distribution de 
Poissdn cuya funcidn de probabilidas es p(x\ X) = e~ K k x /xl. Obtener destimador 
eficiente de X. 

' ' ' ' \ 

Dado que p(x\ X) = X* exp(-X)/jc!, 


y 


In p(x; X) = x in(X) - X - ln(jc!) 

d In p(x\ X) _ x 
•x dk ~ k~ 


Entonces 


= (x - X)/X. 


din p(X\ X) 
dk 


= E[(X - X)/X1 2 


= A E(X - k) 2 

A 


Var(X) 

x 2 ; 


pero si X es una variable aleatoria de Poisson, VariX) = k. Lo anterior da como re- 
sultado 


^ln p{X■ X) j 2 


\_ 

X’ 


y, por la definicion 8.5, la varianza del estimador eficiente de X es 

Var{T) = —= k/n = <r 2 /n, 
n/k 

en donde o- 2 = X es la varianza de la poblacion. Por lo tanto, el estimador eficiente 
del parametro X de Poisson es la media muestral X. 

Se concluira esta seccion sobre las propiedades deseables de los estimadores 
regresando al importante concepto de estadisticas suficientes. Este concepto es im- 
portante puesto que si existe un estimador eficiente, se encontrara que tambien es 
una estadistica suficiente. 


8.2.4 Estadisticas suficientes 

De manera intuitiva, una estadistica suficiente para un parametro 9 es aquella que 
utiliza toda la informacion contenida en la muestra aleatoria con respecto a 0 . Por 
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ejemplo, supongase que AT,, X 2 .Ay, es una muestra aleatoria de 50 observa- 

ciones de una distribucion gama con una funcion de densidad 

\ - f(x;2,0) = -jpxexpi-x/e) * > 0, 

en donde el parametro de escala 0, 0 > 0, es desconocido. Con una estadistica sufi- 
ciente para 0, lo que se tiene es una manera de resumir todas las mediciones de los 
datos de la muestra en un valor en el que toda la informacion de la muestra con res- 
pecto a 0 se encuentre contenida en este valor. Para este ejemplo, el estimador 

T= (X, + X 3 + - + A 49 )/25 

^contiene toda la informacion pertinente con respecto a 6? A pesar de que el estima¬ 
dor T proporciona un solo valor, no es posible que este contenga toda la informa- 
ci6n muestral con respecto a 0, dado que se ha excluido la mitad de las observa- 
ciones. iQue puede decirse acerca de la media muestral? Con toda seguridad esta 
incluye todas las observaciones de la muestra aleatoria. iSignifica esto que toda la 
informacibn muestral con respecto a 0 se extrae considerando a XI Se dice que una 
estadistica T = u(X lt X 2 , ..., X„) es suficiente para un parametro 0 si la distribu¬ 
cion conjunta de X u X 2 , ..., X n , dado T, se encuentra libre de 0; es decir, si se 
afirma T, entonces X u X 2 . .... X„ no tiene nada mas que decir con respecto a 0. 

La utilidad de una estadistica suficiente recae en el hecho de que si un estimador 
insesgado de un parametro 0 es una funcion de una estadistica suficiente, entonces 
tendra la varianza mas pequefla de entre todos los estimadores insesgados de 6 que 
no se encuentren basados en una estadistica suficiente. De hecho, si existe el estima¬ 
dor eficiente de 0, se encontrara que este es una estadistica suficiente. Un criterio 
para determinar una estadistica suficiente esta dado por el siguiente teorema, el cual 
se conoce como teorema de factorizacion de Neyman. 

Teorema 8.4 Sea X x ,X v ..., X n una muestra aleatoria de una distribucion con una 
fitncion de densidad de probabilidad/(jc; 0). Se dice que la estadistica T - u{X u 
X v ..., X,) es una estadistica suficiente para 0 si y solo si la funcion de verosimilitud 
puede factorizarse de la siguiente forma: 

L(x i, ,r 2 .,v„; 0) = h(t\0) . x>.,v„) 

para cualquier valor t = u(x t , x 2 . x„ ) de Ty en donde #(.r ,, x 2 , ■ ■ ■, x „) no con- 

tiene al parametro 0. 

Ejemplo 8.4 Sea X,. X 2 , .... X„ una muestra aleatoria de una distribucion gama 
cuya funcion de densidad de probabilidad es 

/(.r: 0) = - r - , ‘ x" 1 exp( -x/0) x > 0, 

I (a)0 

y en donde el valor del parametro de forma a es conocido. Obtener una estadistica 
suficiente para el parametro de escala 0. 


www. FreeLibros. com 








8.2 Propiedades deseables de los estimadores puniualei 263 


La funci6n de verosimilitud es 


Ux x , * 2 ,..., x .; 6) = /Or,; 0)f(x 2 ; 0) -f(x n ; 0) 


rSjr exp( - jri/w 

\ 

ex P( ~x„/0) 




X 1 / v njrT' 

= M X A -- ^ j p(.t|..r;. x „) 

Por el teorema 8.4, S” = , A", es una estadistica suficiente para 0. 

Supongase, en el ejemplo 8.4, que se considera un estimador de 0 de la forma 


T = — 2 X,. ( 8 . 8 ) 

na ", 

puede verse que 7 es una funcion de la estadistica suficiente 2A',. 

Por lo tanto, 7 tambien es una estadistica suficiente para 6 dado que la funcidn de 
verosimilitud para el ejemplo 8.4, puede factorizarse como 

L(x:,,x 2 , ■■■<x„) = h(t; 0)g(x u x 2 , ...,x n ). 


en donde 2A r , = naT y 


Mt; 0) = ~zr a exp (-nat/0). 

U 


Como resultado se tiene que se satisfacen las condiciones del teorema de factoriza- 
ci6n. De hecho, puede demostrarse que cualquier funcidn uno a uno de una estadis¬ 
tica suficiente, tambien es suficiente. 


Ejemplo 8.5 Sea A - ,. X 2 . X„ una muestra aleatoria de una distribution de 

Poisson cuya funcion de probabilidad es 

p(x\ X) — X' exp( - K)/x\ x = 0,1,2 . 

Demostrar que el estimador eficiente de X es a su vez una estadistica suficiente. 

Del ejemplo 8.3, recuerdese que el estimador eficiente de X es la media muestral 
X. Se necesita demostrar que A es una funcion uno a uno de una estadistica suticien- 
te para X. La funcion de verosimilitud es 
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L(x ,, x 2 , ..., x n ; X) = p(x,-,k) p{x 2 \ X) ••• p(x„;k) - \ 

X JII exp(-X) X* 2 exp(-X) X J,, exp( - X) 

x,! x 2 l x n \ 

n 

_ x 2i * iJt ''exp(-nX)/n x f ! 

= h(lIxf, X) g(x t ,.x 2 , ...,x n ) 

en donde 

/i(Sx,;X) = X 2 "' 1 exp(-rtX). 

Por el teorema 8.4, la estadistica , X, es suficiente para X. Dado que el estimador 
X es una funcion uno a uno de esta estadistica, X tambien es suficiente para X. 


8.3 Metodos de estimation puntual 

En la seccion anterior se mencionaron las propiedades deseables de un buen estima¬ 
dor. En esta seccion se estudiar& c6mo obtener estimadores que, de manera general, 
tengan buenas propiedades. Especificamente se considerar&n los metodos de maxi¬ 
ma verosimilitud y el de momentos. En el capitulo 13 se encontrara el metodo de 
minimos cuadrados que se emplea para ajustar ecuaciones. 

8.3.1 Estimacion por maxima verosimilitud 

Para introducir el concepto de estimacion de maxima verosimilitud, piense en el si- 
guiente hecho. El desborde de rios y lagos es un fenomeno natural que a veces tiene 
devastadoras consecuencias. Supongase que en cierto ano hubo dos serias inunda- 
ciones, por este fenomeno, en determinada region geografica. Si se supone que el 
numero de inundaciones por aflo en esta localidad es una variable aleatoria de Pois¬ 
son con un valor del parametro X.desconocido, ^como debeprocederse paraestimar 
el valor de X con base en una sola observation x = 2? Un posible metodo es selec- 
cionar el valor de X para el cual la probabilidad del valor observado es maxima. Es 
posible, para el valor observado, que X sea cualquier numero positivo. Para proposi- 
tos de la presentation, supongase que los posibles valores de X son 1, 3/2,2,5/2 y 3. 
Las probabilidades para el valor observado x - 2 para cada uno de estos valores de 
X son las siguientes: 


X 

l 

3/2 

2 

5/2 

3 

p( 2; x) 

0.1839 

0.2510 

0.2707 

0.2565 

0.2240 


Aparentemente p( 2; X) crece hasta un valor maximo de 0.2707 para X = 2, y 
disminuye para X > 2. El valor de 2 de X es el que maximiza la probabilidad del va¬ 
lor observado. En otras palabras, la observation x = 2 tiene una probabilidad ma¬ 
yor de ocurrencia para una distribution de Poisson con X = 2 que para cualquier 
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otro valor del par4metro X. Puede demostrarse que el valor X = 1 es el que maximi- 
zaa X = 2 tomando la primera derivada de p(2; X) conrespectoa X eigualandola 
a cero. Dado que 11 

p(2; X) = X 2 exp(-X)/2!, 

se tiene 

dp{ 2; X) 1 . 

d\ = 2 ~ X exp *~ X) + 2x exp(-X)] 

Igualando la primera derivada a cero se tienen las raices X = 0 o X = 2. La segunda 
derivada con respecto a X da como resultado la expresi6n exp(- X)[l — 2X + 
(X 2 )/2],cuyo valor para X = 2es-exp(-2) < 0. De esta forma, el valor x = 2es 
aquel para el cual el valor de la probabilidad de la observacibn es maximo. Este va¬ 
lor recibe el nombre de estimador de maxima verosimilitud. 

En esencia, el metodo de estimacibn por maxima verosimilitud, selecciona como 
estimador a aquel valor del parametro que tiene la propiedad de maximizar el valor 
de la probabilidad de la muestra aleatoria observada, En otras palabras, el metodo de 
maxima verosimilitud consiste en encontrar el valor del par&metro que maximiza 
la funcion de verosimilitud. 

Definition 8.6 Sea XX 2 , .... X„ una muestra aleatoria de una distribution con 
funcion (densidad) de probabilidad f(x; 6), y sea L(x u x 2 , ...,x„;8) la verosimili¬ 
tud de la muestra como funcion de 8. Si t = Mix,, x 2 , .... x n ) es el valor de 8 para 
el cual el valor de la funcion de verosimilitud es maxima, entonces T = u{X { , X 2 , ..., X „) 
es el estimador de maxima verosimilitud de 8, y t es el estimador de mdxima verosi¬ 
militud. 

El metodo de maxima verosimilitud (MV) tiene la propiedad (deseable) de pro- 
porcionar estimadores que son funciones de estadisticas suficientes, siempre y cuando 
el estimador MV sea unico. Ademas, el metodo MV proportiona el estimador eficien- 
te, si es que existe. Sin embargo, los estimadores MV son generalmente sesgados. El 
procedimiento para obtener este tipo de estimadores es (relativamente) directo. Debi- 
do a la naturaleza de la funcion de verosimilitud se escoge, por lo comun, maxi¬ 
mizar el logaritmo natural de L(8). Esto es, en muchas ocasiones es mas facil obtener 
el estimado MV maximizando lnL(0) que L(8). En los siguientes ejemplos se ilus- 
tra el metodo. 

Ejemplo 8.6 En un experimento binomial se observan X = x exitos en n ensayos. 
Obtener el estimador de maxima verosimilitud del parametro binomial p. 

En este caso la funcion de verosimilitud es identica a la probabilidad de que X = 
x\ de esta forpia 

Uxip) = - - n -~- r p'(\ - p) n ~ x , 

(n - jc)ijc! 

t 
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Entonces ' 

lnL(x; p) = ln(n!) - ln[(/i - *)!] - ln(jc!> + a:I n(p) + (n - x)ln(l - p). 

Para encontrar el valor de p, para el cual lnL {x: p) tiene un valor m&ximo, se toma 
la primera derivada con respecto a p y se iguala a cero: 

d[lnLU; p)\ = x _ (,n - x) _ 

dp p (1 - p) 

Despues de resolver para p, se obtiene el estimador MV de p el cual recibe el nombre 
de proportion muestral X/n, y el estimado MV es x/n. Para confirmar que este valor 
maximiza a lnL(jc; p), se toma la segunda derivada con respecto a p y se evalua en 
x/n: 

d 2 [\nL(x; p)] _ np( 1 - p) + (.r - np)( 1 - 2p) 

IP( 1 - P)] 2 

(x/n)\ 1 - (x/n)] x/n<h 

lo que confirma el resultado, dado que la segunda derivada es negativa. Para un 
ejemplo especifico, si se observan x = 5 con base en 25 ensayos independientes, el esti¬ 
mado MV dep es 5/25 = 0.2. 


dp 2 


d 2 [InLCr; p)] 




Ejemplo 8.7 Sea A",, X 2 , ..., X„ una muestra aleatoria de una distribucion normal 
con una funcion de densidad de probabilidad 

f{x\ p,ct 2 ) = — l . - exp[ - (a - p.) 2 /la 2 ]. 

\/2tt(t 

Determinar los estimadores de p. y cr 2 . 

Para este problema se proceder& de la misma forma que en el caso de un sol® pa- 
rametro. Dado que la funcion de verosimilitud depende tanto de p. como de cr 2 , los 
estimados MV de p. y cr 2 son los valores para los cuales la funcion de verosimilitud 
tiene un valor maximo. De acuerdo con lo anterior 


L(x { , x z , ..., x„; p, o- : ) = — i- expt-U, - pf/lv 2 } ■■■ 


\/2 


7 TCT 


x exp[ - (x„ - p.f/2(j 2 ] 


= (27Tcr 2 ) nt2 exp 


1 


- — S (x, - p .) 2 

2a i=1 


1 " 

lnL(.V|, x : ,. x„\p, a 2 ) = -^ln(2n-) - ^ln(o- 2 ) - r—; 2 ~ P-f- 

l l Id 
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Despues de obtener las primeras derivadas parciales con respecto a p. y con respecto 
a tr 2 e igualandolas a cero, se tiene 

5[lnL(/A, cr 2 )] 2 ' ^ 

--- = ~z~2 Z ( x ; - M) = 0 

dfJ. 2<T 

y \ 

y . - 


d[lnL(/x,<r 2 )] 

^((r 2 ) 


2<r 2 + 2<r 4( *' M) °‘ 


Resolviendo la primera ecuacion para /x, sustituyendo este valor en la segunda y re- 
solviendo para cr 2 , se tiene 


A = S *./'» = * 

I 

y 

n 

d- 2 = 2 (x,- ~ xf/n. 

i= 1 

A pesar de que no se verificara que estos valores maximizan la funcion de verosi- 
militud, ellos son los estimados MV de /x y cr 2 , respectivamente. Si existe alguna duda 
t6mense las segundas derivadas. Sin embargo, dado que una funci6n de verosimi- 
litud es el producto, ya sea de probabilidades o de densidades, estas generalmente se 
encuentran acotadas y son continuas en los par&metros. En consecuencia, el resulta- 
do usual es que la solucidn de la primera derivada proportional el valor para el cual 
la funcion es maxima. 

N6tese que se ha introducido la acostumbrada notacion “sombrero” " para de¬ 
notar un estimador MV. Se empleara esta notacion cuando sea necesario. Notese 
tambien que el estimador MV de cr 2 es sesgado, confirmandose de esta manera un 
comentario anterior en el sentido en el que los estimadores MV no necesariamente 
son insesgados. 

El metodo de maxima verosimilitud posee otra propiedad deseable conocida 
como propiedad de invarianza. Sea 0 = u(X ,, X 2 , ..., X„) el estimador de maxima 
verosimilitud de 0. Si g(6) es una funcion univaluada de 6, entonces el estimador de 
maxima verosimilitud de#(0)es g(d). Por ejemplo, dado que, cuando se muestrea 
una distribution normal, el estimador MV de cr 2 es 


a- 2 = - X (x, - x) 2 , 
n ,, 


por la propiedad de invarianza, el estimador MV de la desviacion estandar a es 


<7 = 




X? 


1/2 


www. FreeLibros. com 








268 Estimacidn puntual y por intervato 


Como ejemplo adicional de la propiedad de invarianza, el estimador MV de la fun- 
cion de confiabilidad Weibull es 

R(t) = exp [ — (//§)“], 

en donde 0 es el estimador MV del parametro de escala 0. 


8.3.2 Metodo de los momentos 

Quiza el metodo mas antiguo para la estimacidn de parametros es el metodo de los 
momentos. Este consiste en igualar los momentos apropiados de la distribucion de la 
poblacion con los correspondientes momentos muestrales para estimar un para¬ 
metro desconocido de la distribucion. 

Definicidn 8.7 Sea X ,, X 2 . X„ una muestra aleatoria de una distribucion con 

f un"idn (densidad) de probabilidad f(x\ 0). El r-esimo momento alrededor del cero 
se define como 

M’ r = -2*;. 

«/-1 

El metodo de los momentos proporciona una alternativa razonable cuando no se 
pueden determinar los estimadores de maxima verosimilitud. Recuerdese que los pa¬ 
rametros son, en general, funciones de los momentos teoricos. Por ejemplo, si la va¬ 
riable aleatoria X tiene una distribucion gama (vease la seccion 5.5), entonces 


p. = ad 


( 8 . 10 ) 


p' 2 = a(a + 1)0 2 . 

Resolviendo (8.10) para a y sustituyendo en (8.11), se tiene 

a = p/6 


( 8 . 11 ) 


( 8 . 12 ) 


= £(£+ I 0 s 


= p~ + pd. 


6 = {p' 2 - p 2 )/p. 

Sustituyendo (8.13) para 0 en (8.12), se obtiene 

« = M 2 /(M2 - M 2 )- 


(8.13) 


(8.14) 


De esta forma, los dos parametros de la distribucion gama son funciones de los pri- 
meros dos momentos alrededor del cero. 
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En esencia, el metodo se implementa igualando tantos momentos muestrales con 
los correspondientes momentos teoricos tantas veces como sea necesario para deter-- 
minar un estimador de momentos para un parametro desconocido. Por ejemplo, pot 
(8.13) y (8.14), los estimadores de momento de los par&metros gama-0 y a son’’" 


e = (M' 2 -x 2 )/x x 

(8.15) 

5 = X 2 /(M' 2 - X 2 ), 

(8,16) 


respectivamente, en donde se emplea la notation de tilde (~) para denotar un esti¬ 
mador de momentos. Como ilustracion adicional, recuerdese el ejemplo 4.10. Se de- 
mostrara que los parametros p y k de una distribution binomial negativa tambien 
son funciones de los primeros dos momentos alrededor del cero, ya que 

P = p/ip-2 ~ P 2 ) 


y 

k = p /(fl2 - /A 2 - p). 


Por lo tanto, los estimadores de momentos de p y k estan dados por 


p = x/m - x 2 ) 

(8.17) 

k = X 2 /(M' 2 -X 2 - X), 

(8.18) 


respectivamente. 


8.3.3 Estimation por maxima verosimilitud para muestras censuradas 

En algunas situaciones de muestreo, en forma especial en las pruebas de duration, el 
procedimiento de prueba puede terminar antes de proporcionar una muestra aleato- 
ria completa. En esta seccibn se considerara el principio de maxima verosimilitud 
para la estimation de parametros desconocidos con base en este tipo de muestras, las 
cuales reciben el nombre de muestras censuradas o Iruncadas. En este contexto, 
las ideas se concentraran, en forma exclusiva, alrededor de la nocibn de una prueba 
de duracion. 

Una prueba tipica de duracion consiste en articulos iguales (tales como compo- 
nentes electricos o mecanicos) seleccionados en forma aleatoria de un proceso y ope- 
rados en un medio cuidadosamente controlado hasta que el articulo falla. En este 
caso, la medicibn de interes es el lapso de tiempo que cada unidad tarda en fallar. Si 
la prueba de duracion se termina solo cuando todas las unidades de la muestra han 
fallado, se dice que la muestra aleatoria de tiempos esta completa. Sin embargo, por 
restricciones economicas y de tiempo, generalmente la prueba termina ya sea des¬ 
pues de un lapso de tiempo predeterminado x 0 o despues de que falla un determina- 
do numero de unidades m n. Las dos condiciones producen muestras censura- 
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das. Si X 0 es un lapso fijo de tiempo, el numero de unidades que fallan de Jas n, des- 
de el comienzo de la prueba hasta el tiempo x 0 , es una variably aleatoria; esta consti- 
tuye una muestra censurada de tipo I. Si m$$ fijoy el tiempo determination X m es la 
variable aleatoria, se dice que la muestra,es de tipo II. Sin considerar la inferencia, 
existe muy poca diferencia entre estos dos tipos de muestras. De acuerdo con lo ante¬ 
rior, se restringM la presentacibn al muestreo censurado de tipo II. 

Los datos muestrales de una prueba de duracibn son los tiempos en los que se dio 
una falla. Por ejemplo, supbngase que la primera falla ocurrib en un tiempo igual a 
x { desde el comienzo, la segunda se presenta a x 2 desde el comienzo y asi hasta que 
ocurre la m-esima falla en un tiempo por x m , en donde m n es el numero, fijado 
de antemano, necesario para terminar la prueba. Los tiempos que se observaron de falla 
x v x 2 , .... x m constituyen una secuencia ordenada, porque x, *£ x 2 ••• *£ x m . 
Nbtese que en el momento en que se da por terminada la prueba, existen n - m uni¬ 
dades que todavia no han fallado; estas n - m unidades tienen un tiempo de supervi- 
vencia x„. Es claro que se tiene el tamaflo completo de la mu^str- cuando m = n. 

Supbngase que los tiempos de duradbn de las unidades son variables aleatorias 
X ,, X 2 , .... X„ independientes exponendalmente distribuidas, con una fundbn de densidad 

fix; 6) = exp(-jr/^)> x > 0, 9 > 0. 

El interes recae en encontrar el estimador de maxima verosimilitud del parametro (). La 
fundbn de verosimilitud para un muestreo censurado del tipo II es la probabilidad con- 
junta de que fallen m unidades en los tiempos x,, x 2 ,..., x m en ese orden, y sobrevivan 
n-m unidades con un tiempo de supervivencia igual a x„,. La parte de la fundbn de ve¬ 
rosimilitud que corresponde a las m unidades que han fallado en los tiempos x ,, x 2 , ..., 
x m , es f(x,; 8)fix 2 ; 0) fix m ; 9). Pero esta es solo una de las posibles formas en que 
pueden fallar m unidades de un total de n. El numero total de formas es n'./in - m)\. 
La probabilidad de que n-m unidades sobrevivan un tiempo x m , esta dada por la fun- 
cibn de confiabilidad a tiempo x m ; de esta forma, para la distribudbn exponential, 

PiX > x m ) = exp(-x m /0). 

Por lo tanto, la funcion de verosimilitud es 


L(X|, x 2 , x m ; 6) = 


n\ 


(„-„)! H‘ xp <-*■/*> 


m terminos 


n\ 

in - m)\ 
n\ 

in - m)\ 



exp i-x m /6) ••• exp i~x m /0) ' 

V- w -/ 

in- m) terminos 



■ exp 


(n-m) 

9 




(8.19) 
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en donde; 


.{■'J . :'■ 




•dpOfciS 1 .:- Afti ■ • K'i: W, •/ Tm ~ X X i + ( n ,.„ m ) X ni-~j : , .if., ,»U£)O7v^0?i^ 

ri |, s . I -1 , . 

Tomando el logaritmo natural de L, se tiene ; j ■ u 


- l V ./ 


lnL(.r,,.r 2 . x„,; 6) = ln(n!) - lni(rt - //?)!] - m\nd - ~T m . 

U 


Entonces 


d[\nL{x lt x 2 ,x m \d)] = _ m 1 

de 6 0 2 m ' 

e igualando la derivada a cero, el estimado de maxima verosimilitud de 9 es 


e = 


X x , + (n ~ m )*n 


m. 


( 8 . 21 ) 


Ejemplo 8.8 Las calculadoras cientificas de bolsillo comunmente disponibles con- 
tienen paquetes de bateria que deben reemplazarse despues de una cierta cantidad de 
tiempo de uso. Supongase que de un proceso de produccion se seleccionan, en forma 
aleatoria, 50 paquetes de baterias y se someten a una prueba de duration. Se decide 
terminar la prueba cuando 15 de los 50 dejan de funcionar de manera adecuada. Los 
tiempos observados, en orden, en los que ocurrio la falla, son 115, 119, 131, 138, 
142, 147, 148, 155, 158, 159, 163, 166, 167, 170 y 172. Si los anteriores valores son 
realizations de un conjunto de variables aleatorias independientes exponencialmen- 
te distribuidas, se debe obtener el estimado de maxima verosimilitud para 9. 


En este ejemplo, 

15 

n = 50, m = 15, ^ x, = 115 + 119 + ••• + 172 = 2250, y jt l5 = 172. 

i= I 

Por lo tanto, por (8.21), 

s 2250 + (50 - 15)172 „ , 

9 = -—- = 551.33 horas. 


8.4. Estimation por intervalo 


Para introducir la notion de una estimation por intervalo, supongase que una tienda 
mantiene muy buenos registros con respecto al numero de unidades de cierto pro- 
ducto que vende mensualmente. Para la compailia es muy importante conocer la de- 
manda promedio ya que con base en esta se lleva a cabo el mantenimiento del inven- 
t •se - ^“po qt la demand andel producto no se ve afectada por fluctuaciones 


r 

+ $ 

rt f 


1 a 

a o 
+ - edpo 
a - • - 


m 


an 


~ r m opequ - a 

fcgri pn 
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la media muestral es x = 200 unidades. En otras palabras, x = 200 es un estimado 
puntual de un parimetro desconocido, el cual representa la demanda promedio de 
este producto en la tienda. Este estimador, £implica que la demanda media descono- 
cida no sea mayor de 250 ni menor de 150? En este punto no es posible saberlo, ya 
que no se tiene ninguna indication del posible error en el estimado puntual. El error 
en el estimado puntual se mide en terminos de la variation muestral del correspon- 
diente estimador. 

Por ejemplo, supongase que la desviacion estandar de la media muestral A es 60 
unidades. De acuerdo con el teorema central del Umite, puede argumentarse que 
X —> N(p., 60), conforme n —> oc. De esta forma, la probabilidad de que X se en- 
cuentre dentro de dos desviaciones estandar alrededor d ep., es de, aproximadamen- 
te, 0.95. En otras palabras, para n grande, 

P(\X - fi\< 120) = 0.95, 
o 

P(- 120 < X - p < 120) = 0.95. (8.22) 


Restando X y multiplicando por -1 en el interior de los parentesis, se tiene 

P(X - 120 < (i < X + 120) = 0.95. (8.23) 

Si se sustituye el estimado para x = 200 A, se tiene 


/>(80 <p< 320) = 0.95, 


(8.24) 


lo que sugiere que es enteramente posible que la demanda sea tan grande como 250 
unidades o tan pequefta como 150 unidades, siempre que d.e.(X) = 60. Por otro la- 
do, supongase que la desviacion estandar de A - es igual a 10. Entonces, la expresion 
correspondiente a (8.23), es 

P(X - 20 < p. < X + 20) = 0.95,' 


y para x ~ 200, 


P(180 < p. < 220) = 0.95. 


En este caso es poco probable que p. sea tan grande como 250 o tan pequeno como 
150. 

En ambos casos la clave para resolver el problema se encuentra en la desviacion 
estandar del estimador puntual. En esencia, para la estimacion del intervalo se consi- 
deran, tanto el estimador puntual del parametro d, como su distribucion de muestreo, 
con el proposito de determinar un intervalo que, con cierta seguridad, contiene a 6. 

Para tener una mayor idea acerca de la estimacidn por intervalo, es necesario in- 
terpretarel significado de (8.23) y (8.24). Dado que X es una variable aleatoria, el in¬ 
tervalo X - 120 a X + 120 es un intervalo aleatorio, y la probabilidad de que 
este intervalo contenga el valor verdadero de pi es de 0.95. En otras palabras, si se ob- 
tuviesen muestras del mismo tamaflo en forma repetida de una poblacion, y cada vez 
que estas se seleccionan, se calculan los valores especificos para el intervalo aleatorio 
(A - 120, A + 120); entonces debe esperarse que un 95% de estos intervalos 
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contengan d valor de la media desconodda p. Por otto lado, d intervalo espedfico entte 
80 y 320 no es mds que una realization del intervalo aleatorio (X - 120, X 4- 120); 
con base en los datos de una sola muestra, en la que el estimado es j = 200. 
Dado que el valor de probabilidad de 0.95 se refiere s61o al intervalo aleatorio 
(X - 120, X + 120), es incorrecto decir que la probabilidad de que p se.encuentre 
contenido.en el intervalo (80, 320) es de 0.95. Esto es, no puede asociarse ningun va¬ 
lor de probabilidad a la proposici6n 80 < p < 320, debido a que esta contiene s61o 
constantes. Sin embargo, la probabilidad de 0.95 para el intervalo aleatorio sugiere 
que la confianza en que el intervalo (80, 320) contenga el valor de la media descono- 
cida p es alta. Solo en este sentido se permite asignar un grado de confianza a 
la proposition 80 < M < 320 igual a la probabilidad del intervalo aleatorio (X - 
120, X + 120); asi, cuando se escribe 

P (80 < p < 320) = 0.95, 

no se estd formulando ninguna proposicibn probabilistica en el sentido clcisico, sino 
mds bien se expresa un grado de confianza. De acuerdo con lo anterior, el intervalo 
(80, 320) recibe el nombre de intervalo de confianza del 95°7o para p. 

En terminos generates, la construction de un intervalo de confianza para un pa- 
rametro desconocido 9 consiste en encontrar una estadistica suficiente T y rela- 
cionarla con otra variable aleatoria X* = /(J; 0), en donde X involucra a 9 pero 
la distribucibn de X no contiene a 6, asi como tampoco a ningun otro par&metro des¬ 
conocido. Entonces se seleccionan dos valores x, y x 2 tales que 

P(x t < X < x 2 ) = 1 - a, 

en donde 1 - a recibe el nombre de coeficiente de confiaza. Mediante una manipu- 
lacion algebraica de las dos expresiones, se puede modificar el contenido entre pa- 
rentesis y expresarlo como 

P[hAT) < 9 < h 7 (T)] = l - a, 

en donde /i,(7)y /j 2 (J)son funciones de la estadistica Jy de esta forma, variables alea- 
torias. El intervalo de confianza para 0 se obtiene sustituyendo en /z,(7) y h 2 (T) 
los estimadores calculados a partir de los datos muestrales, dando origen a lo que 
se conoce como intervalo de confianza bilateral. Al seguirse el mismo procedimien- 
to, tambien pueden desarrollarse intervalos de confianza unilaterales, de la forma 

P[gt(T) <9]= l - a 
o 

P[6 < g 2 (T)] =l-a. 

El primero es un intervalo de confianza unilateral inferior para 9, y el segundo es un 
intervalo de confianza unilateral superior. 

A continuation se examinaran varias situaciones que involucran la construction 
de intervalos de confianza para medias y varianzas poblacionales. Sera aparente que 

* Este metodo recibe, en general, el nombre de metodo pivotal, y X se conoce entonces como variable 
aleatoria pivotal. 
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la discusi6n aqui presentada tiene nn ftierte parecido al material de las secciones7.4 


'M'il: r : ■ - ! :^t‘r ■ v ! l'j V-: 

’ ft? "■* -f-* it 

8.4.1 Intervalos de confianza para p cuando se muestrea 
ana distribution normal con varianza conocida 


Sea X s , X 2 , .... X„ una muestra aleatoria de una distribucion normal con media 
desconocida/a, pero con una varianza a 2 conocida. El interes recae en la construed 6n 
de un intervalo de confianza de un 100(1 — a)% sobre p yen donde a es un nume- 
ro pequefio, tal que 0 < a < 1. La construction de un intervalo de confianza se hace 
con base en el mejor estimador de p, explicitamente la media muestral X. 

Para ilustrar el enfoque fundamental para la construction de intervalos de con¬ 
fianza, considerese la proposition probabilistica dada por (8.22). Sumando p dentro 
de los parentesis, se tiene 


P(p - 120 < X < p +■ 120) = 0.95. 

De esta forma, los limites p - 120 y p + 120 son funciones de los posibles valores 
de p. Por lo tanto, y en general, se puede escribir 


de manera tal que 


y 


P[g\{p) <X< = 1 - a, 

rg i ( m ) 

J ^ fix; p)dx = a/2 
f f(x; p)dx = a/2, 


(8.25) 


en donde fix; p) es la funcion de densidad de la distribucion de muestreo de X, y 
g\(p)y g 2 (p) son funciones de p las cuales no contienen a ningun otro parametro 
desconocido. 

De interes inmediato es la determination de g,ip) y g 2 ip). Dado que X ~ Nip, 
cr/^/n), la normal estandar Z - (X - p)/ia-/y/n), y 


Plgdp) < X < g 2 ip)} = P 


g iip) -_p <z< sM. ~ t 

cr/xjn <r/xjn 


= 1 — a. 


(8.26) 


Peroyaque Piz a/2 < Z < z, _„ /2 ) = 1 - a, en donde los valores cuantiles z a/2 
y Zi- a / 2 son tales que P(Z < z„ r _) = a/2 y PiZ <z,_„ /: ) = 1 - a/2, respectiva- 
mente, se sigue que 


g\ip) - P = 
<r/\/n 


(8.27) 


y 


g 2 ip) - p 
er/yn 
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Dando solucidn a (8.27) y (8.28) en tferminos de g,(/x) y g 2 (p), respectivamente; 
se obtienen ticffWfirisi 

V ! i •• ■ ■'Oi •; . .> -fL-.n >OiJ 5 b toi 0 » 

gitp) => +■ Za /2 - 7 = ■ n fab (8i29) 

V" 



\ 


£ 2 ^) = M + Z |- a /2 



(8.30) 


Dado que para la normal estandar z a/2 = ~z,_ a/2 , puede sustituirse ~z,- a/2 para 
z a /2 en (8.29).-De acuerdo con lo anterior, pueden sustituirse las expresiones (8.29) 
y (8.30) para £,(/i.) y g 2 ([i), respectivamente, en (8.25) para obtener 

p(fl — Z\ - a/2 ~~r z < X < fl + Z\ -a / 2 — 7 =) = 1 — a. (8.31) 

V \n \Jn! 


A1 manipular las desigualdades que se encuentran dentro de los parfentesis en (8.31), 
se tiene 

- Zt -a/2 ^ M < X + Z\ -a/2 = 1 - a, (8.32) 


quees unageneralizacionde laproposicionprobabilistica(8.23). La probabilidadde 
que el intervalo aleatorio de X - Zl - a/2 {ar/y/n) a X + z,- a/2 ((r/y/n) conten- 
ga el verdadero valor de la media /x es 1 - a. Si se reemplaza la variable aleatoria 
X en (8.32) por el estimado x calculado a partir de los datos de una muestra de tama- 
flo n, un intervalo de confianza del 100(1 - a)% para n, es 


■^ ± Zi-a/ 2 - 7 =. (8-33) 

v« 

endonde x - Z[- a /i (o-/V w ) yx + Z\- a / 2 (cr/y/n) reciben el nombre de limites de 
confianza inferiores y superiores, respectivamente, para /x- Esto es, el intervalo 
de confianza (8.33) es un intervalo estimado para /x. 

A1 examinar el intervalo de confianza para /x dado por (8.33), es facil, relativa- 
mente, observar que entre mas grande es el tamaflo de la muestra, mas pequeflo es el 
ancho del intervalo; o para un coeficiente de confianza 1 - a mbs grande, mayor 
es el ancho del intervalo. Ambos resultados son logicos ya que un tamaflo grande de 
la muestra disminuira la varianza del estimador, y un coeficiente de confianza gran¬ 
de incrementa el valor cuantil dando como resultado un intervalo mas amplio. 


Ejemplo 8.9 Los datos que a continuacion se dan son los pesos en gramos del con- 
tenido de 16 cajas de cereal que se seleccionaron de un proceso de llenado con el pro- 
posito de verificar el peso promedio: 506, 508, 499, 503, 504, 510, 497, 512, 514, 
505, 493, 496, 506, 502, 509, 496. Si el peso de cada caja es una variable aleatoria 
normafcon una desviacion estandar a = 5 g, obtener los intervalos de confianza 
estimados del 90, 95 y 99%, para la media de llenado de este proceso. 
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Para un coeficiente de confianza del 90%, a = 0.1. El valor Z 0.95 seobtienede 
la tabla D del apendice y es igual a 1.645, ya que P(Z > 1.645) = 0.05. Con base 
en los datos muestrales, el valor de x es de 503.75 g. Entonces un intervalo de con¬ 
fianza del 90% para la media del proceso de llenado es 

- 503.75 ± 1.645—7=, 

\/l6 

o de 501.69 a 505. 81. Los otros intervalos de confianza deseados se obtienen si- 
guiendo el mismo procedimiento. Los resultados se encuentran resumidos en la tabla 
8 . 1 . 

En este momento se considerara un problema que es enteramente similar al del 
ejemplo 8.2. Supongase que se especifica que el muestreo se efectua sobre una 
poblacion que tiene una distribucion normal con media p desconocida y varianza 
cr 2 conocida. Se desea estimar el tamafio necesario deja muestra de manera tc'. qu", 
con una probabilidad de 1 = a, la media muestral X s^ encuentre en un intervalo 
igual a e unidades alrededor de la media de la poblacion p- La expresion (8.31) 
puede reescribirse como 

I a / 2 ^=<X - p<z l - a/ 2 ^=j = \ — a, (8.34) 

la cual da como resultado 

P(\X - p\<e) = \ - a 

en donde 

e = z.-„/2-^. (8.35) 

Al resolver para n en (8.35) se obtiene el resultado deseado, 

n = | : '-^ 2Cr j ( 8 .3 6 ) 

La unica diferencia entre las expresiones (8.6) y (8.36) es que la primera se obtu- 
vo sin especificar la distribucion de la poblacion, mientras que para la segunda se su- 
puso que el muestreo se llevaba a cabo sobre una distribucion normal. Por lo tanto, 
es razonable esperar, a pesar de que las dos expresiones sean iguales, que un valor de 
n obtenido mediante el empleo de (8.36) sera mucho mas pequefio que el correspon- 
diente valor que se obtiene mediante el empleo de (8.6), debido a que para (8.36) se 


TABLA 8.1 Intervalos de confianza para el ejemplo 8.9 


Confianza 

Z 1 - 0/2 

Limite inferior 

Limite superior 

90% 

1.645 

501.69 

505.81 

95% 

1.96 

501.30 

506.20 

99% 

2.575 

500.53 

506.97 
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formularon ma$ hipotesis. Para comparar, si se supone que se esta muestreando una 
distribucion normal, el tamaflo de la muestra que corresponde a las condiciones da- 
das en el ejemplo 8 . 2 ,podria ser , • a f>« 

' 1 (1.645) 2 10 _ i:! 

r - “ 7 - 

\ 

comparado con el valor de n = 25 dado por ( 8 . 6 ). 

Desde el punto de vista de la aplicacion, el hecho de que ambas expresiones ten- 
gan como hipotesis el conocimiento de la varianza de la poblacibn o - 2 constituye un 
requisito muy severo. Si no se conoce el valor de <r 2 debe usarse un estimado de cr 2- * 
que quizci pueda encontrarse en una muestra previa. Si este estimado no se encuentra 
disponible pero se conoce, en forma aproximada, el intervalo en el cual se en- 
cuentran las mediciones, una estimation muy burda de la desviacion estandar es 
igual a la sexta parte del recorrido de las observaciones, ya que para muchas distri- 
buciones unimodales la gran mayoria de las observaciones se encontrar&n dentro de 
un intervalo igual a tres desviaciones estandar, ya sea a la izquierda o la derecha 
de la. media. 


8.4.2 Intervalos de confianza para p cuando se muestrea 
una distribucion normal con varianza desconocida 

Se considerara el problema de encontrar un intervalo de confianza para p, cuando 
se muestrea una distribucion normal y para la cual no se tiene conocimiento acerca 
del valor de la varianza. De la section 7.6, recuerdese que cuando se muestrea una 
N{p, cr), en donde tanto p como cr 2 son desconocidos, la variable aleatoria 


T = 


X - p 

S/Vn 


(8.37) 


tiene una distribucion t de Student con n - 1 grados de libertad. Por lo tanto, es po- 
sible determinar el valor cuantil /, _ u/2 de T, para el cual 

P(-t l - a/ 2 .n-,<T<t l _ a/2 . n „ l ) = l - a, (8.38) 

en donde el valor cuantil estal que P( T < — /|- o/2 . «-,) = a/2yP(T „-i) 

= I - a/2. A1 sustituir para T en (8.38), se tiene 


o 


y 


x - p 

— _„/2. | < /- < 1 1-a/2. /I-I 

S/yn 


= 1 — a 


5 

P| _ h-alJ. n — I 7= < X — p < /, l 


V« 


= 1 - a 


P\X - t, 


-a/2. n~ I < p < X + /|_. /2 . — , “ 7 =) = 1 “ “• (8J9) 

yn ynJ 
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Por lo tanto, el intervalo X ± /,_ o/2 . „_j (S/\Jn) es un intervalo aleatorio y la 
probabilidad de que este contenga el valor verdadero de/z, es 1 — a. De esta forma, 
dados los datos de una muestra aleatoria de tamaflo n a partir de los cuales se calcu- 
lan los estimados x y s 2 , un intervalo de confianza del 100(1 - a)% para p. es 

\ A 1 X ± f)-a/2. rt-l ~ f- (8.40) 

\]n 

Con prop6sitos de ilustracion y comparacion, la tabla 8.2 lista los intervalos de con¬ 
fianza del 90, 95 y 99% para/z, con base en (8.40) y mediante el empleo de los datos 
del ejemplo 8.9, en donde x — 503.75 y s = 6.20. N6tese que para el caso que invo- 
lucra a la distribucion t de Student, los intervalos son mas amplios. 


8.4.3 Intervalos de confianza para la diferencia de medias cuando se 
muestrean dos distribucicnes normales independientes 


Sean X t , X 2 , .... X„ x y Y u Y 2 , Y nr dos muestras aleatorias de dos distribu- 
ciones normales independientes, con medias y varianzas y ~l, respecti- 

vamente. Se desea construir un intervalo de confianza para la diferencia p x - p Y . 
Supongase que se conocen los valores de las varianzas. Entonces, de la seccion 7.7, 
la variable aleatoria 


Z = 


X - Y ~{p X ~ fly) 



(8.41) 


es N (0, 1). De esta forma es posible encontrar el valor cuantil z, -„ n% tal que 


P( Z, - a /2 < Z < z | -a/ 2 ) — 1 ~ a. 


(8.42) 


Mediante la sustituci6n de (8.41) en (8.42) y despues de manipular algebraica- 
mente las desigualdades, se tiene 


P X - Y - 


-a/2 . 


— + — < Px 

n x n Y 


P-Y 


<x 



(8.43) 


TABLA 8.2 Intervalos de confianza para el ejemplo 8.9 


Confianza /, _„ /2 „ , Limite inferior Limite superior 

90% 1.753 501.03 506.47 

95% 2.131 500.45 507.05 

99% 2.947 499.18 508.32 
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que es u(i intervalo aleatorio que no contiene parametros desconocidos. -Al igual 
que en el caso de la section 8.4.1, la variable aleatoria pivotal es la normal estandar 
Z. De acuerdo con lo anterior, un intervalo de confianza del 100(1 - a)% para 

Mat ~ MyCS 



y ± Zi-a/l 




‘ (8.44) 


en donde el valor cuantil z,- a/2 , es tal que P(Z < z t _„ /2 ) = 1 - a/2. 

Si las varianzas <r* y c t\ se desconocen pero son iguales, entonces la variable 
aleatoria 



X Y (Mjt Pr) 



tiene una distribucion t de Student con k = n x + n Y - 2 grados de libertad. 
A1 seguir el procedimiento anterior, se tiene que un intervalo de confianza del 100( 1 
- a)% para n x ~ l^r, es 


X ~ y ± 1 1 - a/ 2.k Sp 



en donde el estimado combinado de la varianza comun es 

2 _ ( n X ~ 1)^ ( n Y ~ l)^y 

P n x + n r — 2 


(8.45) 


Ejemplo 8.10 Se piensa que los estudiantes de licenciatura de contaduria pueden 
esperar un mayor salario promedio al egresar de la licenciatura, que el que esperan 
los estudiantes de administration. Recientemente se obtuvieron muestras aleatorias 
de ambos grupos de un area geografica relativamente homogenea, proporcionando 
los datos que se encuentran en la tabla 8.3. Determinar un intervalo de confianza 
unilateral inferior del 90% para la diferencia entre los salarios promedio para los es¬ 
tudiantes de contaduria y los de administration al egresar de la licenciatu¬ 

ra (suponga que las varianzas <r A y <r/ f son iguales). 


A partir de los datos muestrales dados, pueden calcularse las siguientes cantidades: 


»A 

x A 


10 

>h, = 

14 

16 250 

*M = 

15 400 

1 187 222.22 

''Al = 

1 352 307.69 

■v;. = 1 

284 772.73 

• s 7< = 

1133.48. 
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TABLA 8.3 Salarios anuales initiates para recten gfaduados 


Contadores , n; , . - Administradores 


$16 300 



18 200 


15 100 

17 500 , 


13 900 

16 100 

• • 

14 700 

15 900 


15600 

15 400 


15 800 

15 800 


14 900 

17 300 


18 100 

14 900 


15 600 

15 100 


15 300 



16 200 



15 200 



15 400 



16 600 


Entonces, un intervalo de confianza unilateral inferior del 90% esta dado por 



-Xw A).9. 22 S p 


'J_ ± 

n A rt.v, ’ 


en donde el valor t 0 9 22 = 1.321, ya que para la distribution t de Student, P(T < 
1.321) = 0.9. A1 Sustituir los resultados numericos, se tiene 


16 250 - 15 400 - (1.321X1133.48) 


'vo + V4 = 230 05 - 


De esta forma, un intervalo de confianza unilateral del 90% para la diferencia real 
entre los salarios promedio es de $230.05. 


8.4.4 Intervaios de confianza para a 1 cuando se muestrea 
una distribution normal con media desconocida 


Se examinara el problema de construction de un intervalo de confianza para la va- 
rianza de la poblacion rr ’ cuando se muestrea N(p, cr). De la section 7.5, se recor- 
dara que bajo estas condiciones, la distribution de muestreo de in - I )S : /<r es 
chi-cuadrada con n - 1 grados de libertad. Entonces es posible determinar los valo- 
res cuantiles X.‘. „ \ y Xi - ,,/z. „ - i, tales que 


P 


X7,/i. „■ 


< 


(n 


1 )S- 


< 


Puede expresarse (8.46) como 



«. 


(8.46) 


1 


> 


a 


,Xa/2. n- I 


(n - 1)5 2 


> 


Xl-a/2. 


= 1 ~ 
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Entonces el intervalo 

' (n - IKS 0 (n - 1)5- 1 ' 

_Xl-«/2. h—I .^ r Xu/2.h-1 

es un intervalo aleatorio el cual contiene a a 2 y a parametros conocidos con 
una probabilidad de 1 - a. De esta forma, con base en los datos de una muestra 
aleatoria de tamaflo n, se calcula el estimado s 2 y un intervalo de confianza del 
100(1 - a)% para cr 2 ,esde(/i - 1 )j 2 /Xi- q /2 . n -i a(« - 1 )s 2 /xl/ 2 . „ - 1 • Es intere- 
sante notar que la variable aleatoria pivotal es (n - 1 )S 2 /cr 2 ya que su funcion de 
densidad, dada por (7.16), no contiene ningun parametro desconocido. 

Ejemplo 8.11 Un proceso produce cierta clase de cojinetes de bola cuyo diametro 
interior es de 3 cm. Se seleccionan, en forma aleatoria, 12 de estos cojinetes y se mi- 
den sus diametros internos, que resultan ser 3.01, 3.05, 2.99, 2.99, 3.00, 3.02, 2.98, 
2.99, 2.97, 2.97, 3.02 y 3.01. Suponiendo que el diametro es una variable aleatoria 
normalmente distribuida, determinar un intervalo de confianza del 99% para la va- 
rianza cr 2 . 

Dado que la confianza deseada es del 99%, a - 0.01 .De la tabla E del apendice, 
los valores cuantiles X«<*>\ m y Xd.w. M son 2.60 y 26.71, respectivamente. Para 
terminar, el valor calculado de la varianza muestral es .v 2 = 0.0005455. Por lo tanto, 
un intervalo de confianza del 99% para cr 2 es 

(12 — 1)(0.0005455) (12 - 1)(0.0005455) ~ 

26.71 ’ 2.60 J' 

o 

(0.0002246. 0.0023079). 

Como lo ilustra este ejemplo, el punto medio de un intervalo de confianza para 
una varianza no coincide con el valor del estimador puntual. Sin embargo, cuando 
se construye un intervalo simetrico como lo es el de la media cuando se muestrea una 
distribucion normal, el punto medio del intervalo de confianza coincide con el esti¬ 
mador puntual. 

8.4.5 Intervalos de confianza para el cociente de dos varianzas cuando 
se muestrean dos distribuciones normales independientes 

En el medio industrial muchas veces surge la necesidad de medir y comparar las va- 
riabilidades de dos procesos distintos. Supongase que se tienen muestras aleatorias 
provenientes de dos distribuciones normales con medias y varianzas desconocidas. 
Sean n x y /iy,el tamaflo delas muestras y S x y 5^- las varianzas muestrales. El inte- 
res se centra en construir un intervalo de confianza para el cociente <r Y /a x de las 
dos varianzas poblacionales. De la seccion 7.8, se recordara que la variable aleatoria 
(S\/cr 2 x )/(S\/cr]) tiene una distribucion F con n x - I y n Y — 1 grados de liber- 
tad. Entonces puede escribirse 
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. o y/ & r 


a, 


(8.47) 


en donde a y b son los valores cuantiles inferior y superior de una distribution F tales 
que 


^ l//*l — a/2. n I, n Y -I 


^ JI-a/2. n r -l ■ 


La proposition de probabilidad dada por (8.47) se puede expresar como 

>>U<!-ri<*| = i-« 




(8.48) 


De esta manera, un intervalo de ronfianza del 100(1 - a)% para <Ty/<t x esta dado 
por 

(as\/sx, bsy/sl). 

Para ilustrar, recuerdese el ejemplo 8.10. Supongase que se desea un intervalo de 
confianza del 90% para cr^/cri. De la tabla G, los valores cuantiles son 

a = I//0.95. .3. 9 = 1/3.05* = 0.328, 

b ~/ 0 . 95 . 9 . u = 2.71. 

Ya que s\ = 1 187 222.22 y sh = 1 352 307.69, un intervalo de confianza del 
90% para el cociente ctm/ctI de las dos varianzas desconocidas es 

[(0.328)(1 352 307.69)/1 187 222.22, (2.71)(1 352 307.69)/! 187 222.22] 


% 

i 


(0.3736, 3.0868). 


8.4.6 Intervalos de confianza para el parametro de proporcion p 
cuando se muestrea una distribution binomial 

El porcentaje de productos defectuosos de un proceso de manufactura es el baro- 
metro mas importante para medir la calidad del proceso para manufacturar un pro- 
ducto dado. Ya que un articulo puede estar defectuoso o no, el numero de unidades 
defectuosas es una variable aleatoria binomial, si se supone una probabilidad cons- 
tante e independencia. En una muestra aleatoria de tamarlo n el parametro p que 
representa la proporcion de articulos defectuosos es desconocido. Se desea determi- 

* Por interpolation. 
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nar un intprvalo de coofianza para p. A pesar de que es posible determinar intervalos 
de confianza exactos para p (vease [2]), se optara por un intervalo de confianza ba- 
sado en una muestra grande. La razon de esta decision tiene sus raices en el teorema 
S.l, el cual establece que la distribucibn de una variable aleatoria binomial tiende 
hacia una normal cuando n tiende a infinito. 

Se demostro en el ejemplo 8.6 que el estimador de maxima verosimilitud de p, 
denotado por P, es 

' # - 'I- P = X/n, (8.49) 

en donde X es binomial con par&metros nyp. Nbtese que P es un estimador insesga- 
do de p, ya que 

E(P ) = - E(X ) = np/n = p. 
n 

1 1 varianza de P se puede obtener de la siguiente forma: 

Var(P) = Var(X/n) 

= -4 [np( 1 - p)] 
n 

= P( 1 - p)/n. (8.50) 

Recuerdese que para n grande, la variable aleatoria (X - np)/\/np(\ - p) es 
aproximadamente N{ 0, 1). Entonces puede demostrarse que la distribucibn de 

(8.51) 


tambien tiende a N( 0, 1) para rt grande. De esta forma, la probabilidad del intervalo 
aleatorio 




es, en forma aproximada, 1 — a para n grande. De acuerdo con lo anterior, un in- 
tervalo de confianza aproximado del 100 (1 - a)% para el parametro de proporcion 

P, es 



(8.53) 


en donde el estimador de maxima verosimilitud p = x/n se obtiene de la muestra 
aleatoria de tamaflo n. 
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Ejemplo 8.12 Un fabricante asegura, a una compaflia que le compra un producto 
en forma regular, que el porcentaje de productos defectuosos no es mayor del 5%. 
La compaflia decide comprobar la afirmacibn del fabricante seleccionando, de su in- 
ventario,'200 unidades de este producto y prob&ndolas. iDeberi sospechar la com¬ 
paflia de la afirmacibn del fabricante si se descubren un total de 19 unidades defec- 
tuosas eri la muestra? , 

La sospecha estara apoyada si existe un intervalo de confiabilidad alta para el 
cual la proportion p se encuentra completamente a la derecha del valor asegurado 
0.05. Se selecciona una confiabilidad del 95%. Dado que la realization de la variable 
aleatoria X es x = 19 y n = 20, el estimado de p es 19/200 = 0.095. A1 sustituir en 
(8.53), se tiene 


0.095 - 1.96 


/0.095(1-0.095) 


200 


0.095 + 1.96 


/0.095(1 -0.095) 


200 


el cual resulta ser (0.5436, 0.1356). Aparentemente existe una razon para sospe¬ 
char de la afirmacibn del fabricante, ya que el intervalo de confianza se encuentra 
completamente a la derecha del valor asegurado. 

Con respecto al muestreo de una distribucibn binomial, un problema que surge, 
en forma frecuente, es el de estimar el tamafio de la muestra necesario de manera tal 
que con una confiabilidad de 100(1 - a)% aproximadamente, el estimado del pa- 
rametro de proporcibn se encuentre a no mas dee unidades de p. Dado el estimador 
de maxima verosimilitud X/n y siguiendo el mismo procedimiento de la seccion 
8.4.1, puede expresarse (8.52) como 


en donde 



P 



— 1 — a. 


y p( i - p ) 


Al resolver para n, se obtiene 

n = |“| „ :/?(l - p)Ve z . (8.54) 

Notese que en la expresion anterior n es una funcion del valor deseado de p. 
Dado que este no se conoce y, de hecho, es la cantidad que se esta intentando estimar, 
lo que de manera general se hace es determinar el valor mas conservador de n. Esto 
ocurre cuando la cantidad /?(1 - p) es maxima. Pero puede demostrarse que para 
0 < p s 1, p(l - p) es un maximo cuando p = 1/2. En otras palabras, el valor p = 
1/2 es el que debe emplearse para obtener el tamaflo deseado de la muestra con base 
en (8.54). 

A manera de advertencia, los metodos presentados en esta seccion deben usarse 
solo cuando el tamaflo de la muestra es suficientemente grande. De otro modo, de- 
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herein emplearse los intervalos de confianza exactos. A lo largo de estos lineamien- 
tos, de nuevo debe hacerse enfasis en que se supuso que el muestreo siempre se lleva- 
ba a cabo sobre una distribucibn normal. La construccibn de intervalos de confianza 
para las varianzas es, en forma especial, sensible a esta hip6tesis. Cualquier des- 
viacion sustantiva de esta hipbtesis significara una perdida de la validez de la infe- 
rencia formulada con respecto a las varianzas. Por otro lado, los metodos para in¬ 
tervalos de confianza que involucran medias son, eh forma relativa, inmunes a 
modestas desviaciones de la hipbtesis de normalidad siempre y cuando el tamaiio de 
las muestras sea grande. De esta forma, los mbtodos presentados de la seccibn 8.4.1 
a la 8.4.3, tienen una gran validez para muestras de gran tamafio, aun si el muestreo 
no se lleva a cabo sobre una distribucion normal. 

Para ilustrar que el uso de la distribucion t de Student sigue siendo valido para 
inferencias con respecto a las medias, aun a pesar de que se muestree una distribucibn 
que no es normal, se simulb el siguiente experimento mediante el empleo del paquete 
IMSL. Se generaron 1 000 muestras de tamaflos 15, 30 y 50, a de una distribu¬ 
cibn exponencial con parametro 6 = l A . Ya que 0 es la media de una variable alea- 
toria exponencialmente distribuida, se empleo (8.40) para calcular un intervalo de 
confianza del 95% para 6 para cada muestra aleatoria y se conto el numero de inter¬ 
valos que no contenian el valor supuesto de 10. Para n = 15 se encontro un total 
de 86 de estos intervalos; para n = 30 se tienen 68 y para n = 50 se encontraron 55. 

Si el muestreo se hubiese llevado a cabo sobre una distribucibn normal, se 
esperarian (0.05) (1 000) = 50 de estos intervalos, de entre 1 000. Parece ser que los 
resultados se acercan a los esperados bajo un muestreo de una distribucibn normal 
conforme aumenta el tamaiio de la muestra aun a pesar de que esta no provenga de 
una distribucibn normal. De acuerdo con lo anterior, el efecto que se dene por una 
violacion de la hipbtesis de normalidad cuando se utiliza la distribucibn t de Student, 
parece ser pequeiio, aun para un tamafio n relativamente modesto. 

8.5 Estimacion bayesiana 

Hasta este momento se ha estudiado la inferencia estadistica desde el punto de vis¬ 
ta de la teoria del muestreo, el cual se basa en la interpretacibn de la probabilidad 
como una frecuencia relativa. En esta seccion se estudiara el enfoque bayesiano de la 
inferencia estadistica y, en particular, a la estimacion de parametros. Recuerdese 
que el enfoque bayesiano se basa en la interpretacibn subjetiva de la probabilidad, el 
cual considera a esta como un grado de creencia con respecto a la incertidumbre. El 
punto de vista bayesiano considera un parametro desconocido como una caracteris- 
tica con respecto a la cual puede expresarse un grado de creencia que puede modifi- 
carse con base en la informacion muestral. Una inferencia con respecto al parametro 
se formula con base en el grado de creencia modificado. En otras palabras, un para¬ 
metro es visto como una variable aleatoria a la que, antes de la evidencia muestral, 
se le asigna una distribucibn a priori con base en el grado de creencia con respecto al 
comportamiento del parametro aleatorio. Cuando se obtiene la evidencia muestral, la distri¬ 
bucibn a priori es modificada y entonces surge una distribucibn a posteriori. Es esta distribu¬ 
tion a posteriori la que se emplea para formular inferencias con respecto al parametro. 
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El enfoque bayesiano para la estimation de parametros ha sido favorecido por 
muchas personas, en forma especial en aquellas situaciones en las que un parametro 
no puede considerarse, en forma real, como una cantidad fija. Por ejemplo* es pro¬ 
bable que la verdadera proporcion de articulos defectuosos que produce un proceso 
de manufactura fluctiie ligeramente, lo cual depende de numerosos factores, como 
se mostro en el ejemplo 6.9. Es probable que la verdadera proporcion de casas que se 
pierden por concepto de hipoteca varie dependiendo, en primer lugar, de las condi- 
ciones economicas. La demanda promedio semanal de automoviles tambien fluc- 
tuara como una funcion de varios factores incluyendo la temporada. 


8.5.1 Estimation puntual bayesiana 

En esta section se considerara la determination de estimadores puntuales baye- 
sianos. Dado que se considera a un parametro como una variable aleatoria, se deno- 
tara a este por el simbolo 0 y con 9 a la realization de 0. Supongase que 0 es una 
variable aleatoria continua* con una funcion de densidad (a priori ) inconditional 
fe(0), la cual refleja la creencia a priori con respecto a la incertidumbre de 0. 
La information muestral se encuentra representada por n variables aleatorias IID 
X,, X 2 , .... X n , con una densidad fix j 9) condicional comun sobre la realization 
9 de 0. Del capltulo 7, la funcibn de verosimilitud, condicional a un valor particular 
0, es 

L(x t , x 2 , ..., x„ | 0) = /(*, | d)f(x 2 1 9) ■■■f(x n | 0). (8.55) 

Es importante hacer enfasis en que aun cuando 0 es una variable aleatoria, el obje- 
tivo es estimar el valor particular de 9 para el cual la evidencia muestral que repre- 
senta la funcion de verosimilitud se encuentra condicionada. Es decir, 0 es una 
variable aleatoria no observable que puede tomar varios valores (entre ellos d ,) que 
deriven el resultado muestral. Mediante el empleo del teorema 6.2 y, en particular, 
de (6.24), la densidad a posteriori de 0 dado el resultado muestral x = {*,, x 2 , .... 
-rj es 


AO | x) 


L(x\9)M0) 
f L(x | 9)f e (0)dd 

JO 


(8.56) 


Se sabe que la densidad a posteriori f(0 \ x) representa el grado de creencia modifi- 
cado con respecto a la incertidumbre de 0. Pero i,como debe usarse la densidad a 
posteriori para obtener un estimador puntual de 0? Para este propbsito, el enfoque 
bayesiano** toma en cuenta una funcion de perdida, que representa la consecuen- 
cia economica resultante de haber escogido a t = u(x) como el valor estimado cuando 
el valor verdadero es 6. Esto es, la funcion de perdida evalua la perdida economica 
cuando se dice que el valor de 0 es t, cuando este es 0. Una funcion de perdida, de- 
notada por lit, 9), es una funcion no negativa defy 9 de tal forma que esta es cero 


* Es mas probable que un parametro desconocido sea continuo que discreto, pero este ultimo caso 
puede manejarse en forma similar. 

” Para una presentation mas completa del enfoque bayesiano se invita al lector a que consulte [6], 
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solo si / es igual a 6. Notese que la funci6n de perdida depende del parametro aleato¬ 
ric 0; por lo tanto, esta tambien es una variable aleatoria. En este momento se est& en 
condiciones de definir un estimador bayesiano. 

Defitaicibn 8.8 Sea f e (d) la funcibn de densidad a priori de un parbmetro 0, y 
L{x i, x 2 , ...,x n [ 6) la funcibn de maxima verosimilitud de una muestra aleatoria de 
n variables aleatorias IID condicionadas sobre la'realizacibn 6 de 0. Adem&s, sea 
f(0 | x) la funcibn de densidad a posteriori de 0, y sea lit, 0) la funcibn de pbrdi- 
da. El estimador Bayes de 6, T = u(X t , X 2 , ..., X n ), es aquel para el cual el valor 
esperado de la funcibn de perdida dada por 

mu 0)] - \ Kt, 0)f{0 1 x)d0 

J 0 

es minimo. 

En la definicibn 8.8 es claro que para determinar un estimador Bayes, debe espe- 
cificarse una funcibn de perdida. La especificacibn de esta ultima es una tarea difi- 
cil, ya que las consecuencias economicas no son f&cilmente medibles. En muchos 
problemas de aplicacibn puede formularse un argumento razonable para utilizar una 
funcibn de perdida de la forma. 


l{t, 6) = (t - 0)\ (8.57) 

la cual se conoce como funcibn de perdida cuadratico o de error cuadratico. Para 
una funcibn de perdida cuadr&tica puede demostrarse que el estimador Bayes de 0 
es igual a la esperanza a posteriori £(0 | x), de 0. En otras palabras, la media de la 
distribucibn a posteriori de 0 es el estimador Bayes de 0 para una funcibn de perdi¬ 
da de error cuadratico. Nbtese que esta es una eleccion razonable para estimar el va¬ 
lor de la realizacibn 0, ya que la media de una variable aleatoria es una medida de 
tendencia central y representa el centro de gravedad de la distribucibn de probabili- 
dad de la variable aleatoria. 

Ejemplo 8.13 Un vendedor distribuye sistemas estereofbnicos, los cuales garantiza 
por un periodo de dos aflos. Con base en informacion previa, el vendedor piensa que 
la proporcion de unidades que seran enviadas a servicio o a reemplazo durante el pe¬ 
riodo de dos aflos tiene un valor cercano a 0.04, aunque existen ligeras variaciones 
de este valor. El vendedor piensa asignar a priori una distribucibn beta a la propor- 
cion con parametros a = 1 y (3 = 24. Con base en una muestra aleatoria de 25 
unidades, el vendedor observa dos unidades que necesitaran servicio o reemplazo 
durante el periodo de dos aflos. Suponiendo que el numero de unidades que necesita¬ 
ran, ya sea servicio o reemplazo en una muestra fija de n unidades, es una variable 
aleatoria binomial, obtener el estimador Bayes de la proporcion. 

En el ejemplo 6.9, se demostro que, para las condiciones de este problema, la 
distribucibn a posteriori de la proporcion tambien es una distribucibn beta con una 
densidad dada por (6.36). Denotese a la proporcibn aleatoria por P. Ya que los para- 
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metros de la densidad a posteriori de P son x + ayn + p-x,y mediante el 
empleo de (5.40), la media a posteriori. 


E(P j x) = 


x + a 
n + a + P 


(8.58) 


es el estimador Bayes de la realization p. Antes de calcular el valor del estimador, es 
conveniente comparar el estimador Bayes con el estimador de maxima verosimilitud 
x/n, que se obtuvo en el ejemplo 8.6. Notese que el estimador Bayes coincide con el 
de maxima verosimilitud solo si a = p = 0. Para este problema el resultado 
muestral para n = 25 es x = 2, y los valores de los parametros a priori son a = 1 y 
P - 24. De esta forma, el estimador Bayes es (2 + l)/(25 + 1 + 24) = 0.06, 
y por comparacion, el estimador MV es 2/25 = 0.08. 

Por lo tanto, es evidente que el estimador Bayes se encuentra influenciado tanto 
por el resultado muestral como por la distribucion a priori. De hecho, puede decirse 
que si la distribucion a priori tiene una varianza pequeiia, lo que implica un alto gra- 
do de creencia con respecto a un parametro aleatorio, entonces la media a posteriori 
tendra un valor muy proximo a la media a priori. Supongase, para el ejemplo 8.13, 
que los valores de a y /3 fuesen 2 y 48 en lugar de 1 y 24, respectivamente. En¬ 
tonces el valor de la media a priori deberia ser igual al que se dio en 2/(2 + 48) = 0.04 
pero la varianza a priori debe ser, ahora, igual a 0.0007529, que es un valor mas pe- 
quefio que el anterior (0.0014769). El resultado es la media (2 + 2)/(25 + 2 + 48) 
= 0.0533 y se encuentra mas cercano al valor de la media a priori que el estimado 
previo. Por otro lado, si la distribucion a priori tiene una varianza muy grande, esta 
debe ser virtualmente plana, lo cual implica que la creencia a priori con respecto a la 
incertidumbre de un parametro aleatorio es vaga. En tal caso, la evidencia muestral 
debe tener mucho mas peso en la distribucion a posteriori que en la distribucion a 
priori, y los estimadores de Bayes y MV deberan ser, virtualmente, los mismos. 

El tamaflo de la muestra n tambien tiene influencia sobre la cercania entre los es¬ 
timadores Bayes y MV. En general, los estimadores Bayes y MV diferiran entre si 
por una cantidad que es pequefia cuando se compara con 1 / \/n. De esta manera, 
para tamaflos de la muestra relativamente grandes ambos estimadores se encontra- 
ran muy cercanos el uno del otro. 


8.5.2 Estimation bayesiana por intervalo 

Se puede determinar un intervalo estimado para H mediante el uso de la funcion de 
densidad a posteriori del parametro aleatorio O. 

Definition 8.9 Sea J\0 | y) la funcion de densidad a posteriori de D condicionada 
sobre el resultado muestral t x = {v,. ,v : . a,,}, sean a y b limites tales que 

P(a < O < b | .v) = | f(0 | a )(/<) = y. (8.59) 

J tt 

en donde ay b son funciones del resultado muestral .v. Entonces el intervalo (a, b ) 
es un intervalo bayesiano tal, que la probabilidad de que f) se encuentre contenido 
en (a, b) es y. 
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A diferencia de los intervalos de confianza de la seccibn 8.4, un intervalo baye- 
siano es, en efecto, un intervalo de probabilidad. Gn otras palabras, puede decirse 
que la probabilidad de que y se encuentre contenido en el intervalo a, b es 6, 
mientras que con un intervalo de confianza s6lo puede decirse que una cantidad de 
100y%' de estos intervalos contendr&n el valor real de H. 

Para ejemplificaf un intervalo de probabilidad bayesiano, sea X,, X 2 , .... X„ la 
muestra aleatoria de una distribuci6n normal con media p desconocida y varianza 
cr conocida. Supdngase que la media es un par&metro aleatorio al cual se piensa 
asignar una distribution normal a priori con una funcion de densidad 


fuip) = -=expl-(M - Po?/2a\] 

troV 2tt 


- ^ < fi< 


donde Pn y of, son la media y la varianza a priori, respectivamente. De la presenta¬ 
tion previa (vea:: el ejemplo 8.7), la funcion de verosimilitud dada la realization p 
es 

L(x,.x 2 , .... x„ | p) = (27ro' 2 )~' ,/2 exp[ — S(x, - p) 2 / 2<r]. 

Entonces, puede demostrarse que la densidad a posteriori de la media condi- 
cionada sobre x tambien es normal con media 


E(M\x) 


n&lx + p 0 (T Z 
nal + cr 2 


(8.60) 


y varianza 


Var(M | x) 


a 2 (rl 


noi + 


(8.61) 


De esta forma, el estimador Bayes de p para una funcion de perdida o error cuadra- 
tico esta dada por (8.60). Al igual que en el ejemplo 8.13, notese que un valor pe- 
queflo de la varianza a priori al proporcionara un estimador Bayes para p mucho 
mas cercano a la media a priori p^. Ademas, para Po y al, fijas, conforme n crece 
el estimador de Bayes tiende al estimador de maxima verosimilitud x. 


Ejemplo 8.14 Recuerdese el ejemplo 8.9 en el que se determinaron los intervalos de 
confianza del 90,95 y 99% para el llenado medio p con base en los pesos de 16 cajas 
de cereal seleccionadas en forma aleatoria y en donde se supuso que los pesos esta- 
ban normalmente distribuidos con cr = 5 gr. Debido a pequeflas perturbaciones en 
el proceso de llenado, supongase que el llenado medio es una variable aleatoria nor¬ 
malmente distribuida con media p u = 500 y desviacion estandar a 0 = I. Determi- 
nar los intervalos de probabilidad bayesiana 0.9, 0.95 y 0.99 para p. 

Del ejemplo 8.9, x = 503.75; entonces, mediante el uso de (8.60) y (8.61), los 
valores calculados de la media y la varianza a posteriori son 


E(M j x) 


(16)( 0(503.75) + (500X25) 
(16)0) + 25 


501.4634 
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y ■ 


Var(M | x) = 


' (25)(1) 
(I6)(I) + 25 


= ,0.6098, 


respectivamente. Dado que la densidad a posteriori de Af es M5014634, \A)-6098), 
yyaquepara y =f 0.9, P(— 1.645 < Z < 1.645) = 0.9, endonde Z ~ N( 0, 1), se 
sigue de (8.59) que un intervalo de probabilidad 0.9 para p que sea simetrico con 
respecto a la media a posteriori es - 


E(M | x) ± 1.645 \/Var(M\x). 

De esta fo rma los limi tes son a = E(M | jt) — 1.645 yJVariM | x) y b = E(M | 
x) + l.(A5\/Var(M \ x). A1 sustituir los valores para E{M \ x) y \JVar(M\x), 
se obtiene el intervalo de probabilidad 0.9 (500.18, 502.75) para p. De manera simi¬ 
lar, se calculan los intervalos bayesianos para y = 0.95 yy = 0.99. £stos se en- 
cuentran resumiuos en la tabla 8.4. N6tese que los intervalos de probabilidad baye¬ 
sianos se estrechan de manera mas uniforme que los correspondientes intervalos de 
confianza del ejemplo 8.9. 


8.6 Limites estadisticos de tolerancia 

En la seccion 5.4 se mencionaron los limites estadisticos de tolerancia y se comento 
su importancia para estimar la variabilidad de un producto. En esta seccion se de- 
sarrollaran limites estadisticos de tolerancia cuando se muestrea una distribucion no 
especifica de probabilidad, o cuando el muestreo se lleva a cabo sobre una distribu¬ 
cion normal. Estos limites se conocen como limites de tolerancia independientes de 
la distribucion debido a que esta no se especifica. 

8.6.1 Limites de tolerancia independientes de la distribucion 

Imagine un fenomeno aleatorio que involucre la fabricacion de un cierto producto. 
Sea X la variable de medicion de este fenomeno, y sea f{x\ 0) la funcion de densidad 
de probabilidad de X, en donde 9 es un parametro fijo. 

Definition 8.10 Si D es la proporcion de observaciones de la variable aleatoria que 
se encuentra entre los limites L, y L 2 , que son funciones univaluadas de las observa¬ 
ciones de manera tal que 

D = f f(x; 6)dx = F x (L 2 \9) - F X (L ,; 9 ), - (8.62) 

J Li 

entonces L ] y L 2 reciben el nombre de limites estadisticos de tolerancia. 


TABLA 8.4 Intervalos de probabilidad bayesiana para el ejemplo 8.14 



Probabilidad 

Limite inferior 

Limite superior 



0.9 

500.18 

502.75 



0.95 

499.93 

502.99 



0.99 

499.45 

503.47 
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Ya que L x y L t son funciones univaluadas de las observaciones, ellas mismas 
son variables aleatorias. A su vez, la proportion D es una variable aleatoria, y la 
proposition de probabilidad 


P(D ^d) = y 




tiene un significado que se interpreta como la probabilidad y de que la proporci 6 n 
de valores en la distribucidn de X entre L, y L 2 no sea menoi que d. • 

Sean X (r) y Y ( „_ r+1) el r-esimo valor mas pequeflo y el [n -r + l)-esimo valor 
mas grande, respectivamente, en una muestra aleatoria de tamaflo n la cual invo- 
lucra a la variable de medicion X. Se ha demostrado que la proporci 6 n de valores D 
que seencuentran entre L f = X (r) y l 2 = X ( „_ r+i) tiene una distribution beta con 
parametros a = n - 2r + 1 y /3 = 2r, sin importar la forma de la funcidn de 
densidad de probabilidad de X, en donde L, y t 2 son de orden simetrico. De esta 
forma 


P(D^d) = 1 - F e (d; n - 2r + 1 ,2r) = y. (8.63) 

La expresion (8.63) es muy fuerte porque permite la determinacion de limites 
estadisticos de tolerancia sin necesidad de espetificar la distribucion de la variable 
aleatoria X de interes. Estos limites se conocen como limites de tolerancia indepen- 
dientes de la distribucidn. Notese que la relation (8.63) involucra cuatro cantidades, 
n,r,d y y. Con el uso de las tablas beta el conocimiento de tres de ellas proporciona- 
ra el valor de la cantidad faltante. 

El principal uso de (8.63) es determinar el tamaflo m&s pequeflo de la muestra de 
manera tal que con una probabilidad y por lo menos una proporcidn d de la distri¬ 
bucidn de X se encuentre incluida entre los dos valores extremos de la muestra, *o, 
y X {n) . Esto es, para r = 1, (8.63) se reduce a 


PKD^d) = 1 - F B (d;n - 1,2) = y. 


la que puede simplificarse para obtener 

y=l- [/!</"-■ - (n - 1) d n ], (8.64) 

lo que da como resultado una expresion en la que puede aparecer la funcion de 
distribucidn beta como una suma si uno de los parametros de forma es un numero 
entero pequeflo (vease [ 1 ]). 

En la figura 8.2 se dan varias proporciones utiles de d en funcion del tamaflo de 
la muestra n y la probabilidad 7 . Por ejemplo, si se obtiene una muestra de tamaflo 
25 de una distribucidn con una funcion de densidad desconocida, la probabilidad de 
Que por lo menos el 80% de los valores de X se encuentren entre los dos valores 
extremos de la muestra es de 0.973. 

Muchas veces se buscan limites de tolerancia unilaterales de manera tal que la pro¬ 
babilidad de que por lo menos una proportion d de la distribucidn de X sea mas 
grande de un limite de tolerancia inferior 0 menor que un limite de tolerancia supe¬ 
rior, sea 7 . Puede demostrarse, sin importar la distribucidn de X, que 


P(D 5s d) = I - F B (d; n - r + 1, r) = 7 . 
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FIGURA 8.2 Proporciones d como funciones del tamafto de muestra n y probabilidad 7 . 


Notese que si r = 1, la inferencia se formulara con base en el valor mas pequeflo de 
la muestra, X { i,; si r = n, la inferencia se formulara con base en el valor mas grande, 
*<„>• Puede demostrarse que, para r = 1, la expresion (8.69) se reduce a 

P(D 2 * d) = 1 - d n = 7 . 

De esta manera, al obtener el resultado para el tarnano de la muestra n, se tiene 


log(l - 7 ) 
logW) 


( 8 . 66 ) 


La expresion ( 8 . 66 ) permite la determinacion del tamaflo necesario de la muestra 
para que con una probabilidad 7 , por lo menos una proporcion d de los valores de X 
sean mas grandes que el valor mas pequeflo de la muestra. 
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8.6.2 Limites de tolerancia cuando se muestrea una distribucion normal 

Eri algunas situaciones la distribucion de interes puede modelarse en forma ade- 
cuada por una distribucion normal. En esta seccion se examinaran los limites 
estadisticos de tolerancia para estas situaciones. 

Recuerdese que los limites estadisticos de tolerancia colocan limites sobre las 
mediciones que se llevan a cabo sobre una distribucion a diferencia de los intervalos 
de confTanza, los cuales determinan a aquellos donde es probable que se encuentre 
un parametro desconocido. De esta forma, si el muestreo se Ueva a cabo sobre una 
distribucion N(^i\a) de manera tal que tanto^ como crson conocidos, entonces, por 
ejemplo, los limites /a ± 1.645<r, ^ ± 1.96cr, y n ± 2.515a- incluiran al 90,95 y 
99% de la distribucion, respectivamente. O para los limites unilaterales, el 90% de 
las observaciones de la distribucion excedera el limite inferior de At - 1.28cr,y el 
99% sera menor del limite superior + 2.33o\El unico problema. con toda seguri- 
dad, es que no es muy comun el conocer los valores de la media At y la varianza a 1 . 

Supongase que se consideran los estimadores X y S 2 . Dado que ambos son 
variables aleatorias y estan sujetas a la variabilidad en el muestreo no es verdad 
dear, por ejemplo, que el 90% de la distribucion estara contenido en el intervalo, 
X ± 1.6455. En forma alternativa, considere el intervalo aleatorio X ± kS^cn 
donde k es una_constante apropiada perteneciente a la distribucion conjunta de X y 
5 2 . Dado que X ± kS son limites aleatorios, es imposible establecer con absoluta 
certeza que porcentaje de la distribucion estara contenido entre estos limites. En 
otras palabras, al igual que con los intervalos de confianza, no es posible encontrar 
un valor de k tal que los limites calculados, con base en alguna muestra aleatoria, 
siempre incluyan un porcentaje ft jo de la distribucion. Sin embargo, es posible selec- 
cionar un valor de k tal que si se obtienen en forma repetida muestras del mismo ta- 
maflo de una distribucibn normal, proporcibn fija 7 de estos limites contendrii 
por lo menos un lOQcWo de los valores de la distribucion. Es decir, el intervalo alea¬ 
torio X ± kS tiene una probabilidad y de contener por lo menos un lOOt/% de la 
distribucion normal muestreada. Con base en una muestra aleatoria de tamaflo n los 
limites de tolerancia bilateral de un I00y% para un porcentaje lOOcide una distribu- 
cion normal son x ± ks, en donde y es el coeficiente de confianza y d es el alcan- 
ce de la distribucion. La tabla H contiene valores de k para valores seleccionados de 
n, y. y d. 

Muchas veces solo se tiene interes en los limites de tolerancia unilaterales. Por 
ejemplo, en la fabricacion de pistones, si el diametro se encuentra por debajo de 
cierta tolerancia, el piston debe desecharse. Sin embargo, si el diametro del piston es 
mayor que cierta tolerancia, este puede ser reprocesado hasta alcanzar un nivel acep- 
table. Como era de esperarse, los valores de k para los limites unilaterales no son 
iguales a los que se encuentran en la tabla H. Estos se hallan en la tabla I del apendi- 
ce para los valores de n, y, y d mas frecuentemente utilizados. De acuerdo con lo an¬ 
terior, puede determinarse un valor de k tal que, con una confiabilidad del iOOy % 
de que por lo menos un 100ei% de los valores de la distribucion normal seran mayo- 
res que el limite de tolerancia inferior x - ks. o menores que el limite de tolerancia 
superior x + ks. 
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Ejemplo 8.15 En un medio muy competitive, la disponibilidad de un producto con 
respecto a la demanda es crucial para el exito del negocio. Para determinar un limite 
de tolerancia superior para la demanda mensual de cierto producto, un centro co- 
mercial ha recolectado lo que cree que es una muestra aleatoria de las demandas 
mensuales y la cual consiste en los siguientes datos: 129, 142, 14S, 1S3, 136, 138, 
163,151,146,128,133,148, 144,140,143. Si la demanda mensual de este producto 
se encuentra aproximada en forma adecuada por una distribucibn normal, determi- 
nese un limite de tolerancia superior con y = 0.99 yd- 0.95. 

Para y = 0.99, d = 0.95 y n = 15, se obtiene de la tabla I del apendice un va¬ 
lor de it = 3.102. Con base en los datos, la media y la desviacion estandar muestral 
tienen un valor de x = 142.6 y s = 9.2798, respectivamente. El limite de tolerancia 
superior es 142.6 + (3.102)(9.2798) = 171.39. De esta forma, se tiene el 99% de 
confiabilidad, porque el 95% de toda la demanda ser& menor que 171.39 unidades 
por mes. En otras palabras, si est'* centro comercial almacena aproximadamente 172 
unidades del producto por mes, tendra una alta seguridad de satisfacer la demanda 
mensual de este producto. 

De nuevo, debe hacerse enfasis en que los limites estadisticos de tolerancia de- 
sarrollados en esta seccion se relacionan con el muestreo de una distribucion normal. 
Si existe alguna duda con respecto a esta hipotesis, deberan utilizarse los limites de 
tolerancia independientes de la distribucion que se estudiaron en la seccion 8.6.1. Es 
razonable esperar que los limites de tolerancia independientes de la distribucion sean 
mas conservadores que aquellos basados en la distribucion normal, ya que se en¬ 
cuentra disponible una cantidad menor de informacion. 
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3. A. M. Mood and F. A. Graybill, Introduction to the theory of statistics, 2nd ed., 
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Ejerdtios 

8.1. En un experimento binomial se observan x exitos en n ensayos independientes. Se pro- 
ponen las siguientes dos estadisticas como estimadores del parametro de proporcidn p: 
T\ = X/n y T 2 = (X + 1)/(« + 2). 

a) Obtener y comparar los errores cuadraticos medios para T, y T r 

b) Hacer una grafica del ECM de cada estadistica como funciones de p para n = 10 y 
n = 25. iEs alguno de estos estimadores uniformemente mejor que el otro? 
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8.2. Sea X,, X 2 , X } , y X 4 una muestra aleatoria de tamaflo cuatro de una poblacibn cuya 
distribucibn es exponencial con par&metro 0 desconocido. Delas siguientes estadisticas, 
icuiles son estimadores insesgados de 0? 



r, = ](A, + a 2 ) + +I ( r 


T I = (A, + 2X 2 + 3X } + 4A„)/5 
T } = (X, +X 2 + Xy + X t )/4 


8.3. Demostrar que la estadistica T p en el ejercicio 8.1, es un estimador consistente del pa- 
riinetro binomial p. 


8.4. Mediante el uso del teorema de Tchebysheff, demostrar que la estadistica T r en el ejer¬ 
cicio 8.1, es un estimador consistente del parametro binomial p. 


8.5. De entre los estimadores insesgados de 0 dados en el ejercicio 8.2, determinar cual es el 
que tiene la varianza mas pequefta. iCu41es son las eficiencias relativas de los donas es¬ 
timadores insesgados con respecto al que tiene la varianza mas pequeiia? 

8 .6. Sea AT,, X 2 , X v X 4 y X^ una muestra aleatoria de una poblacion cuya distribucibn es 
normal con media p. y varianza cr 1 . Considerense las estacUsticas T, = (Ai + X 2 + ... 
+ A 5 )/5 y T z = (A, + A 2 + 2A 3 + A 4 + A 5 )/6 corao estimadores de p. ldentificar 
la estadistica que posee la varianza mas pequefta. 

8.7. Mediante el uso de la cota inferior de Cramer-Rao determinar la varianza del estimador 
insesgado de varianza minima de 0 cuando se muestrea una poblacibn cuya distribucibn 
es exponencial con una densidad /(x; 6) = (\/0)exp(-x/6), x > 0. Deducir que d 
estimador eficiente de 0 es la media muestral. 

8 .8. Sea A,, A 2 , .... A, una muestra aleatoria de una poblacion cuyadistribucibn es gama 
con parametro de forma conocido. Demostrar que el estimador de maxima verosimili- 
tud para el parametro de escala esta dado por la expresion (8.8). 

8.9. Sea A ( , A 2 , .... X„ una muestra aleatoria de una poblacion cuya distribucibn es de 
Poisson con parametro X. Obtener el estimador de maxima verosimilitud de X. 

8 .10. Sea A,, A 2 , ..., A„ una muestra aleatoria de una poblacion cuya distribucibn es expo¬ 
nencial con parametro de escala 6- Obtener el estimador de maxima verosimilitud de 0 
y demostrar que este es una estadistica suficiente para 9. 

8.11. Sea A,, A 2 , .... X„ una muestra aleatoria de una poblacion cuya distribucibn es la de 
Rayleigh, con densidad j\x\ tr 2 ) = (x/cr 2 )exp(-x 2 /2cr 2 ), x > 0. Obtener el estimador 
de maxima verosimilitud de cr 2 . £Es esta una estadistica para cr 2 ? 

8.12. De manera equivalente a la defmicion 8.7, se define el r-esimo momento muestral con 
respecto a la media, como 


2 (A, - A Y 

Mr = —- , 

n 

en donde A,, A 2 , .... A„ es una muestra aleatoria. Empleense estos momentos para 
calcular los factores de forma muestrales para los datos dados en el ejercicio 1.1. 
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iPuede formularse cualquier inferencia con respecto a la poblatibn de interes con base 
en los factores de forma? i - 

J ) ip. 

8.13. Repetir el ejercicio 8.12 usando los datos proporcionados en el ejercicio 1.2. 

8.14. La tabla 8.5 es una distribution de frecuencias para accidentes automovilisticos recaba- 
da para un estudio en California.* Asumiendo que el numero de accidentes es una va¬ 
riable aleatoria binomial negaliva, usese el metodo de momentos para estimar los para- 
metros binomiales negatives k y p. Comparar las frecuencias que se observaron con 
aquellas que se obtienen mediante el empleo de los valores estimadores de k y de p. 

8.15. Los siguientes datos son una muestra aleatoria de duracibn en horas, que se observaron 
para un determinado componente electrico: 142.84, 97.04, 32.46, 69.14, 85.67, 114.43, 
41.76, 163.07, 108.22, 63.28. Supongase que la duration de un componente es una 
variable aleatoria de Weibull con parametro de forma a = 2. 

a) Obtener un estimador de maxima verosimilitud para el parametro de escala 0. 

b) El metodo de momentos, idaria jn :timador de 0 diferente al que se obtuvo en la 
parte a? 

c) Mediante el uso de su respuesta al inciso a, estimar la confiabilidad de este compo¬ 
nente para t = 150 horas. 

8.16. Mediante el uso de su respuesta al inciso a del ejercicio 8.15, obtener el tiempo para el 
cual la confiabilidad del componente es de 0.95. 

8.17. Los siguientes datos son tiempos de falla, ordenados en horas de diez componentes que 
fallaran de un total de 40 en una prueba de duracibn: 421, 436, 448, 474, 496, 499. 510, 
525, 593, 675. Supongase que el tiempo de falla es una variable aleatoria exponencial- 
mente distribuida. 

a) Obtener un estimador de maxima verosimilitud para el parametro 0. 

b) Usese la respuesta de la parte a para estimar la confiabilidad de este componente 
para t - 4 000 horas. 

8.18. Una prueba de duration sera terminada cuando fallen m < n unidades. Si el tiempo de 
falla es una variable aleatoria de Weibull con parametro de forma conocido, obtener el 
estimador de maxima verosimilitud para el parametro de escala 6. 

* Multivariate analysis of driver accident frequencies over a period of 14 years, California Department 
of Motor Vehicles, FHWA Project No. B0I49, 1975. 


TABLA 8.5 


Numero de accidentes 

Numero de conductores 

0 

35,068 

1 

13.411 

2 

4.013 

3 

1.184 

4 

353 

5 

93 

6 

29 

7 

8 

8 

4 

9 o mas 

2 
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8.19. Se desea obtener un indicador del fcxito financiero de ciertas tiendas que venden articu- 
los espedales en los centros comerciales de una gran dudad. Se selecciona una muestra 
aleatoria de 30 tiendas ubicadas en distintos centros comerciales y en donde el inter 6 s re- 
cae en el tiempo que festas permanecen en operation, Se tendril un dato signiflcativo 
cuando se observen las primeras ocho tiendas que dejen de funcionar. Los siguientes da- 
tos son el tiempo en orden ascendente, de operation en meses: 3.2, 3.9, 5.9, 6.5, 16.5, 
20.3, 40.4, 50.9. SupOngase que el tiempo en el que permanece operando una tienda de 
esta clase es una variable aleatoria de Weibull con a = 0.8. 

a) Usando el resultado del ejercicio 8.18, obtener el estimador de maxima verosimilitud 

para 0 . ' 

b) Con base en la respuesta del inciso a, £cual es la probabilidad de que una tienda per- 
manezca en operation despues de haber transcurrido dos aflos de su apertura? £ Des¬ 
pues de diez aflos? 

8.20. El tiempo total de procesamiento para programas en tarjetas perforadas de coroputado- 
ra se define como el tiempo que transcurre desde que se 1 m la primera tarjeta hasta que 
se imprime la ultima linea, y esta constituido por tres componentes; el tiempo d“ espera 
de entrada, el tiempo utilizado por el procesador central y el tiempo de espera de salida. 
Los siguientes datos son los tiempos totales de procesamiento, en minutos, para una 
muestra aleatoria de 15 programas similares: 12.5, 5.2, 6 . 8 , 3.6, 10.9, 12.8,7.8, 8 . 6 , 6.3, 

6.9, 18.2, 15.4, 9.2, 10.3,7.3. Supongase que el tiempo total de procesamiento esta mo- 
delado, en forma adecuada, por una distribution gama con a = 3. 

a) Obtener el estimador de maxima verosimilitud para el parametro de escala 0. 

b) El metodo de momentos, £daria un estimado diferente de 0 al determinado en el in¬ 
ciso a? 

c) Mediante la respuesta del inciso a), calcular la probabilidad de que el tiempo de pro¬ 
cesamiento sea mayor a 20 minutos. 

8.21. Un fabricante de fibras sinteticas desea estimar la tension de ruptura media de una 
fibre. Disefla un experimento en el que se observan las tensiones de ruptura, en libras, 
de 16 hilos del proceso seleccionados aleatoriamente. Las tensiones son 20.8,20.6, 21.0, 

20.9, 19.9, 20.2, 19.8, 19.6, 20.9, 21.1, 20.4, 20.6, 19.7, 19.6, 20.3 y 20.7. Supongase 
que la tension de ruptura de una fibre se encuentra modelada por una distribution nor¬ 
mal con desviacion estandar de 0.45 libras. Construir un intervalo de confianza estima¬ 
do del 98% para el valor real de la tension de ruptura promedio de la fibre. 

8.22. Con referencia al ejercicio 8.21, icuales de las siguientes proposiciones son apropiadas 
papra la interpretation del intervalo de confianza? 

a) En la probabilidad de que la tension promedio verdadera se encuentre, los limites de 
confianza son de 0.98. 

b) Aproximadamente el 98%, de todos los intervalos de confianza calculados con base 
en repetidas muestras de tamaflo, 16 obtenidas en el proceso de fabrication de las 
fibras incluiran el verdadero valor promedio de la tension de ruptura. 

c) La probabilidad de que la tension de ruptura para cualquier fibre se encuentre fuera 
de los limites de confianza es 0.02. 

8.23. Mediante el empleo de los metodos de la section 5.9, genere 100 muestras, cada una de 
tamaflo 16, de una distribution normal con media 100 y desviacion estandar 10. Para 
cada muestra, construyase un intervalo de confianza del 95% para m- iCuantos de estos 
intervalos contienen el verdadero valor de 100 paraju.' Vease el ejercicio 8.36. 
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8.24. Una tienda de donas se interesa en estimar su volumen de ventas diarias. Supdngase que 
el valor de la desviacion estandar es de $50. 

a) Si el volumen de ventas se encuentra aproximado por una distribucibn normal, £cual 
debe ser el tamaflo de la muestra para que con una probabilidad de 0.95 la me¬ 
dia muestral se encuentre a no mis de $20 del verdadero volumen de ventas prome- 

'. dio? . _ . >, , 

b) Si no es posible suponer que la distribucibn es normal, obtener el tamaflo necesario 
de la muestra para la pregunta a. 

8.25. Con referencia al ejercicio 8.24, generar 100 muestras, cada una de tamaflo igual al de- 
terminado en el inciso a, de una distribucibn normal con media y desviacibn estindar 
iguales a 400 y 50, respectivamente. Calcular la media muestral para cada muestra. 
tCuintas medias muestrales se encuentran a no mis de $20 del valor conocido de /x? 
iEsti su respuesta de acuerdo con lo que se esperaba? 

8.26. Se piensa que la diferencia entre el sueldo mis bajo y el mas alto que se paga por hora a 
los mecinicos de automoviles es de $9. Si se supone que estos sueldos se encuentran, en 
forma aproximada, distribuidos segun un modelo normal, £cual debe ser el tamaflo de 
la muestra para que con una probabilidad de 0.99 la media muestral se encuentre a no 
mis de un dolar del verdadero salario por hora promedio? Contestese la misma pregun¬ 
ta sin suponer una distribucibn normal. 

8.27. La Camara de Comercio de una ciudad se encuentra interesada en estimar la cantidad 
promedio de dinero que gasta la gente que asiste a convenciones, calculando comidas, 
alojamiento y entretenimiento por dia. De las distintas convenciones que se llevan a 
cabo en la ciudad, se seleccionaron 60 personas y se les pregunto la cantidad que gasta- 
ban por dia. Se obtuvo la siguiente informacion en dolares: 150,175,163,148,142,189, 
135, 174, 168, 152, 158, 184, 134, 146, 155, 163. Si se supone que la cantidad de dinero 
gastada en un dia es una variable aleatoria distribuida normal, obtener los intervalos de 
confianza estimados del 90, 95 y 98% para la cantidad promedio real. 

8.28. Con referencia al ejercicio 8.21, determinar el intervalo de confianza estimado del 98% 
para la tension de ruptura promedio sin suponer que se conoce la desviacion estindar de 
la poblacion. iComo es este intervalo comparado con el que se obtuvo en el ejercicio 
8 . 21 ? 

8.29. Para verificar la sensititividad de la distribucibn t de Student con respecto a la suposi- 
cion de que se muestrea una distribucibn normal, generar 100 muestras aleatorias cada 
una de tamaflo 10 de una distribucibn exponencial con 9 = 20. Para cada muestra, 
construir un intervalo de confianza estimado del 95% para la media. (.Cuantos de estos 
intervalos contienen el valor medio conocido de 0 = 20? Repetir el proceso incremen- 
tando el tamaflo de la muestra a 30. iExiste alguna diferencia? Formular un comentario 
con respecto a sus resultados. Vease el ejercicio 8.37. 

8.30. Una muestra aleatoria de los salarios por hora para nueve mecanicos de automoviles 
proporciono los siguientes datos (en dolares): 10.5, 11,9.5, 12, 10, 11.5, 13,9,8.5. Bajo 
la suposicion de que el muestreo se ilevo a cabo sobre una poblacion distribuida normal, 
construir los intervalos de confianza estimados del 90 , 95 y 99% para los salarios por 
hora promedio para todos los mecanicos. Interpretar los resultados. 

8.31. Dos universidades fmanciadas por el gobiemo tienen metodos distintos para inscribir a 
sus alumnos a principios de cada semestre. Las dos desean comparar el tiempo prome- 
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dip que les toma a los estudiantes completar el trimite de inscripcibn. En cada universi- 
dad se anotaron los tiempos de inscripcidn para 100 alumnos seleccionados al azar. Las 
medias y las desviaciones estandares muestrales son las siguientes: 

-if'; -y'x, = 50.2 x 2 = 52.9 

4 -8 ^ = 5.4 

Si se supone que el muestreo se Uev6 a cabo sobre dos poblaciones distribuidas nor m ales 
e independientes, obtener los intervalos de confianza estimados del 90,95 y 99% para la 
diferencia entre las medias del tiempo de inscripcion para las dos universidades. Con 
base en esta evidencia, ise estaria inclinando a concluir que existe una diferencia real 
entre los tiempos medios para cada universidad? 

8.32. Cierto metal se produce, por lo comun, mediante un proceso estandar. Se desarrolla un 
nuevo proceso en el que se ailade una aleaciPn a la produccidn del metal. Los fabrican- 
tes se encuentran interesados en estimar la verdadera diferencia entre las tenskmes de 
ruptura de los metales producidos por los dos procesos. Para cada metal se seleccionan 
12 especimenes y cada uno de estos se somete a una tension hasta que se rompe. La si- 
guiente tabla muestra las tensiones de ruptura de los especimenes en kilogramos por 
centimetro cuadrado: 


Proceso 

estandar 

428 

419 

458 

439 

441 

456 

463 

429 

438 

445 

441 

463 

Proceso 

nuevo 

462 

. 448 

435 

465 

429 

472 

453 

459 

427 

468 

452 

447 


Si se supone que el muestreo se llevo a cabo sobre dos distribuciones normales e inde¬ 
pendientes con varianzas iguales, obtener los intervalos de confianza estimados del 90, 
95 y 99% para Ms - Ms- Con base en los resultados, £se estaria inclinado a concluir 
que existe una diferencia real entre Ms y M/v? 

8.33. En dos ciudades se llevo a cabo una encuesta sobre el costo de la vida para obtener el 
gasto promedio en aiimentacibn en familias constituidas por cuatro personas. De cada 
ciudad se selecciono aleatoriamente una muestra de 20 familias y se observaron sus gas- 
tos semanales en alimentacibn. Las medias y las desviaciones estindares muestrales 
fueron las siguientes: 

S, = 135 x 2 = 122 

Si = 15 ,s 2 = 10 

Si se supone que se muestrearon dos poblaciones independientes con distribution nor¬ 
mal cada una, y varianzas iguales, obtener los intervalos de confianza estimados del 95 
y 99% paraMi - m? ■ iSe estaria inclinado a concluir que existe una diferencia real entre 
Mi y M:? 

8.34. Se espera tener una cierta variation aleatoria nominal en el espesor de las laminas de 
plastico que una maquina produce. Para determinar cuando la variacion en el espesor se 
encuentra dentro de ciertos limites, cada dia se seleccionan en forma aleatoria 12 lami¬ 
ng de plastico y se mide en milimetros su espesor. Los datos que se obtuvieron son los 
siguientes: 12.6, 11.9, 12.3, 12.8, 11.8, 11.7, 12.4, 12.1, 12.3, 12.0, 12.5, 12.9. Si se su¬ 
pone que el espesor es una variable aleatoria distribuida normal, obtener los intervalos 
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de confianza estimados del 90, 95 y 99% para la varianza desconocida del espesor. Si no 
es aceptable una varianza mayor de 0.9 mm, £existe alguna raz6n para preocuparse con 
base en esta evidencia? , , . < . : r 

8.35. Mediante el uso de los datos del ejercicio 8.27, obtener un intervalo de confianza esti- 
mado del 95% para la varianza desconocida e interpretar el resuitado. 

8.36. Con referenda al ejercicio 8.23, construir para cada muestra un intervalo de confianza 
del 95% para < r 2 . iCuantos de estos intervalos contienen el valor conocido de 100 para 
cr 2 ?iEste resuitado esta de acuerdo con lo que se esperaba? 

8.37. Para verificar la sensitividad de la distribudon chi-cuadrada con respecto a la suposi- 
rion de que se muestrea una distribudon normal, repetir el ejercicio 8.29 construyendo 
para cada muestra un intervalo de confianza estimado del 95% para a 2 . En relacion con 
los dos tamaflos de las muestras, icuantos de estos intervalos contienen el valor conoci- 
do de a 2 = 400? Con base en estos resultados, comparar las sensitividades de las distri- 
budones t de Student y chi-cuadrada con respecto a la hipotesis de un muestreo que se 
lleva a cabo sobre una distribudon normal. 

8.38. Una agencia estatal tiene la responsabilidad de vigilar la calidad del agua para la cria de 
peces con fines comerciales. Esta agencia se encuentra interesada en comparar la va- 
riacion de cierta sustancia toxica en dos estuarios cuyas aguas se encuentran contamina- 
das por desperdicios industriales provenientes de una zona industrial cercana. En el pri¬ 
mer estuario se seleccionan 11 muestras y en el segundo 8, las cuales se enviaron a un 
laboratorio para su analisis. Las mediciones en ppm que se observaron en cada muestra 
se exponen en la tabla 8.6. Si se supone que el muestreo se hizo sobre dos poblaciones 
independientes distribuidas normales, obtener un intervalo de confianza estimado del 
95% para el cociente de las dos varianzas no conocidas crj/cri. Con base en este resuita¬ 
do, ise podria concluir que las dos varianzas son diferentes? iPor que? 

8.39. Con referencia al ejercicio 8.32, construir un intervalo de confianza estimado del 99% 
para el cociente cry/cri, en donde a] es la varianza del proceso estandar y a] es la va¬ 
rianza del nuevo proceso. Con base en este resuitado, ies razonable la suposicion de que 
las varianzas son iguales? 

8.40. La lista electoral final en una eleccion reciente para senador, revelo que 1 400 personas 


TABLA 8.6 Niveles de una sustancia toxica 
(ppm) 


Estuario 1 

Estuario 2 

10 

II 

10 

8 

12 

9 

13 

7 

9 

10 

8 

8 

12 

8 

12 

10 

10 


14 


8 
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' de un total de 2 500 seleccionadas aleatoriamente.tienen prefercncia por el candidato A 
con respecto al candidato B. 


a) 


b) 


c) 


• : i'.-tsr 


Obtener un intervalo de confianza unilateral inferior del 99!% para la verdadera pro¬ 
portion de votantes a favor del candidato A. Com base en este resultadd,* ipodria lis¬ 
ted afirmar que es probable que A gane la election? iPor que? 


Supongase que se selecciona aleatoriamente una muestra de 225 personas con la mis- 
ma proporcion muestral a favor del candidato A. iSon los resultados diferentes a los 
del inciso a)? 

En este caso, ison razonables las suposiciones para los intervalos de confianza apro- 
ximados del 99% ? 


8.41. Se recibe un lote muy grande de articulos proveniente de un fabricante que asegura que 
el porcentaje de articulos defectuosos en la production es del 1%. Al selectionar una 
muestra aleatoria de 200 articulos y despues de inspectionarlos, se descubren 8 defec¬ 
tuosos. Obtener los intervalos de confianza aproximados del 90,95 y 99% para la verda¬ 
dera proportion de articulos defectuosos en el proceso de manufactura del fabricante. 
Con base en estos resultados, £qu': se puede concluir con respecto a la afirmaciOn del 
fabricante? 


8.42. Un medico investigador desea estimar la proportion de hombres, en edad madura, que 
fuman en exceso y que desarrollar&n cancer pulmonar en los siguientes cinco aflos. El 
investigador desea selectionar una cierta cantidad de hombres que hayan fumado por lo 
menos dos cajetillas de cigarros al dia durante 20 aflos y observarlos durante los proxi- 
mos cinco aflos para saber cuantos desarrollan cancer pulmonar. iCual debe ser el ta- 
maflo de la muestra que el investigador debe selectionar de manera tal que con una pro- 
babilidad de 0.95, la proporcion muestral se encuentre a no mas de 0.02 unidades de la 
proporcion verdadera? 

8.43. Las compaflias de auditoria generalmente selectionan una muestra aleatoria de los clien- 
tes de un banco y verifkan los balances contables reportados por el banco. Si una 
compaflia de este tipo se encuentra interesada en estimar la proporcion de cuentas para 
las cuales existe una discrepancia entre el cliente y el banco, icuantas cuentas deberan 
seleccionarse de manera tal que con una confiabilidad del 99% la proporcion muestral 
se encuentre a no mas de 0.02 unidades de la proporcion real? 

8.44. El volumen semanal de ventas de una tienda de descuentos se encuentra representado, 
en forma adecuada, por una distribution normal con media desconocida /x, pero con 
una desviacion estandar de cr = $2 000. Debido a muchas influencias de indole menor, 
se cree que el volumen de ventas semanal promedio puede considerarse como una va¬ 
riable aleatoria. Supongase que se esta pensando asignar una distribution normal a la 
media semanal con fi u = $20 000 y <r„ - $200. Una muestra aleatoria de 16 semanas 
revela un volumen de ventas promedio muestral de $21 500. 

a) Para una funciOn de perdida de error cuadratico, obtener el estimador Bayes de y-- 

b) Obtener un intervalo estimado de probabilidad bayesiano del 95% para m 

c) Obtener un intervalo de confianza del 95% para/x y compararlo con el intervalo esti¬ 
mado en el inciso b). 

d) Repetir los incisos a, b y c con cr 0 = 100. Comentar los resultados. 

e) Repetir lps incisos a, by c con <r„ - 800. Comentar los resultados. 

f) Supongase que n = 64; asumiendo que .v = 21 500, ide que forma afectarian los 
cambios anteriores las respuestas dadas para los incisos a, by cl 
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8.45. Una oficina estatai determin6 que el numero de llamadas telefbnicas que redbe es una 

variable aleatoria de Poisson. Debido a las condiciortesdel mcrcado, la oficina ha lle- 
gado a la conclusibn de que el parimetro de Poisson es una variable aleatoria con distri¬ 
bution gama y parimetros de forma y escala iguales a 20 y 4, respiotiivainente. En un 
dia, seleccionado al azar, se red ben 90 llamadas tdef6nicas. 1<: ' ? ;i : ’ 

\ a) Para una fiintion de perdida de error cuadritico, obtener el estimadOr Bayes del pa- 
rametro de Poisson. . 

b) Obtener un intervalo de probabilidad bayesiano del 95%. (Sugerenda: empleese 
(5.51).) 

8.46. Una compaftia constructora de hoteles se encuentra muy interesada en las tensiones.de 
ruptura de los cables de acero que sostendrin un pasillo por encima del vestibulo del ho¬ 
tel. El contratista hace uso de los servidos de una organization independiente a la cual 
da las instrucdones necesarias para probar los cables y determinar un limite de toleran- 
cia inferior para la tension de ruptura de estos de man era tal que, con una probabilidad 
de 0.95, el 99% de los cables tenga una tensibn de ruptura uaiyor al limite deseado. La 
organization selecdona, en forma aleatoria, 20 cables y los prueba para determinar sus 
tensiones de ruptura. Los resultados de la prueba, en kilogramos por centimetro 
cuadrado, son 2130, 2158, 2192, 2110, 2145, 2208, 2201, 2195, 2125, 2148, 2166, 2172, 
2192, 2138, 2210, 2215, 2108, 2105, 2120 y 2130. Si se supone que la tensibn de ruptura 
es una variable aleatoria distribuida normal, obtener el limite de toleranria deseado. 

8.47. El diametro intemo de un cojinete es una medida crucial en la fabricacion de este. Con 
base en una muestra aleatoria de 25 cojinetes, la media muestral fue de 3 cm y la des- 
viacion estandar muestral fue igual a 0.005 cm. Obtener los limites de tolerancia bilate- 
rales de manera tal que, con una probabilidad de 0.99, el 95% de los diimetros de todos 
los cojinetes manufacturados por este proceso se encuentren dentro de los limites de tole¬ 
rancia. Supongase que el diimetro intemo es una variable aleatoria distribuida normal. 

8.48. Supbngase que en el ejercicio 8.47 no es posible asumir una distribucibn normal. Si de 
los 25 cojinetes, el diametro mis pequeflo fue de 2.984 y el mis grande de 3.013 y se esti 
interesado en un intervalo que contengaal 90,95 o 99% de todos los diimetros intemos, 
icuil es la probabilidad que puede asociarse con el intervalo de 2.984 al 3.013 para cada 
uno de los porcentajes anteriores? 

8.49. Supbngase que no es posible asumir una distribucibn normal en el ejercicio 8.46. Para la 
misma probabilidad y tamaflo muestral, £cual debe ser la proporcion de tensiones de 
ruptura que debe exceder el valor mis pequeflo de las 20 observaciones? iQue tan gran¬ 
de debe ser la muestra necesaria en este caso para tener la misma probabilidad y propor¬ 
tion del ejercicio 8.46? 

8.50. Supbngase que se esta muestreando una poblacion cuya distribucibn de probabilidad es 
desconocida. <,Cual debe ser el tamaflo de la muestra necesario para que, con una pro¬ 
babilidad de 0.99, por lo menos el 95% de los valores de la variable aleatoria de interes 
este incluido entre los dos valores extremos de la muestra? 


8.51. Supbngase que se esta muestreando una poblacion cuya distribucibn de probabilidad es 
desconocida. iCual debe ser el tamaflo de la muestra necesario para que, con una pro¬ 
babilidad de 0.99, por lo menos el 97% de los valores de la variable aleatoria sea mayor 
que el valor mis pequeflo de la muestra? 
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CAPITULO NUEVE 
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Prueba de hipotesis estadisticas 


9.1 Introduccidn 

En el capitulo 8 se examino la inferencia estadlsnca con respecto a la estimaci6n 
puntual y por intervalo. En este capitulo se estudiarb otra area de la inferencia: la 
prueba o contraste de una hipotesis estadistica. Como se vera, la prueba de una hi¬ 
pbtesis estadistica tiene una fuerte relation con el concepto de estimation. 

Una hipotesis estadistica es una afirmacion con respecto a alguna caracteristica 
desconocida de una poblacion de interes. La esencia de probar una hipotesis estadis¬ 
tica es el decidir si la afirmacion se encuentra apoyada por la evidencia experimental 
que se obtiene a traves de una muestra aleatoria. En forma general, la afirmacion in- 
volucra ya sea a algun parametro o a alguna forma funcional no conocida de la 
distribucibn de interes a partir de la cual se obtiene una muestra aleatoria. La deci¬ 
sion acerca de si los datos muestrales apoyan estadlsticamente la afirmacion se toma 
con base en la probabilidad, y, si bsta es minima, entonces sera rechazada. 

En gran medida, el enfoque de este capitulo serb mas intuitivo que tebrico ya 
que el autor piensa que desde este punto de vista el lector estara en position de obte- 
ner una mejor idea de la esencia de las hipotesis estadisticas. En forma initial se de- 
sarrollaran los fundamentos para la prueba de hipotesis estadisticas. Entonces se 
examinaran varias areas de aplicacion con respecto a medidas, varianzas y propor¬ 
tions. 


9.2 Conceptos bdsicos para la prueba de hipbtesis estadisticas 

Para ilustrar la notion de una hipbtesis estadistica, supongase que se tiene interes en 
el tiempo promedio necesario para terminar una unidad en una linea de armado. 
Bajo condiciones de operacion estandares, el objetivo es tener un tiempo promedio 
de armado por unidad de 10 minutos. El gerente de la planta decide continuar con el 
proceso a menos que se encuentre una evidencia sustancial de que el tiempo prome¬ 
dio no es de 10 minutos. La evidencia estara en una muestra aleatoria de tamafto n 
obtenida de la distribucion de interes para el tiempo de armado de una unidad. 
tComo debe decidirse si el proceso continua en operacibn? 
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La respuesta a este tipo de preguntas es el principal objetivo del presente 
capitulo. N6tese que no es de interes, per se, la estimation del tiempo medio desco- 
rtocido/z, sino determinar si el valor de /xes 10. En otras palabras, antes de que la | 
muestra se obtenga, ya se ha conjeturado que el muestreo se llevar& a cabo sobre una 
distribution cuya media es 10. Si la afirmacidn es estadisticamente plausible con 
base en la evidencia experimental, entonces se asumirit que el valor promedio objetivo 
es de 10 minutos y, por lo tanto, se dejara que el proceso continue. Por otro lado, si 
la afirmacidn no est& apoyada estadisticamente por la evidencia muestral, el gerente 
de la planta puede decidir detener el proceso para llevar a cabo los ajustes necesarios. 

A la afirmacidn de que p = 10 se le llama hipdtesis nula y se escribiri como: 

H 0 : p = 10. 

NOtese que con H 0 se ha especificado un solo valor para el par4metro en cuestidn. 

De hecho, si una hipdtesis estadistica asigna valores particu lares a todos los parii- 
metros desconocidos e identiflca la forma funcional de la distribution de interfcs, 
recibe el nombre de hipdtesis sencilla o simple. De otra forma, se conoce como 
hipdtesis compuesta. De esta manera, H 0 : p = lo es una hipotesis sencilla solo si se 
especificaron la forma funcional de la distribution de interes y los valores de los pa- 
rametros desconocidos (si es que los hay). Si la hipdtesis nula se hubiese propuesto 
como H a : p *£ 10 o H 0 : p 5* 10, esta no seria una hipdtesis simple ya que no asig¬ 
na ningun valor especifico para p. 

Una hipdtesis nula debe considerse como verdadera a menos que exista suficiente 
evidencia en contra. En otras palabras, se rechazarii la hipdtesis nula de que el tiem¬ 
po promedio de armado es de 10 minutos, sdlo si la evidencia experimental se en- 
cuentra muy en contra de esta afirmacidn. Un paralelo muy cercano a esta interpre¬ 
tation es el de los procesos judiciales en los que el acusado es inocente hasta que no 
se demuestre lo contrario. Esto es, definiendo a la hipdtesis nula como “inocen¬ 
te”, se insiste en que se rechazarii sdlo si el juicio proporciona evidencia suficiente en 
contra de esta. 

A continuation se analizan las posibles decisiones que pueden tomarse con res- 
pecto a la hipdtesis nula H 0 : p = 10. A1 hacer esto deben tomarse en cuenta las con- 
secuencias que pueden originarse como resultado del verdadero estado de la natura- 
leza: en realidad p, puede o no ser igual a 10. En forma sencilla, existen dos posibles 
decisiones con respecto a H 0 (rechazar H 0 o equivocarse al rechazar H 0 ).* Sin em¬ 
bargo, cada una de estas decisiones tiene las siguientes dos consecuencias con respec¬ 
to al estado de la naturaleza: 


Rechazar H (j 


cuando de hecho Ho es cierta 
cuando de hecho H 0 es falsa 


Equivocarse 
al rechazar H 0 


[cuando de hecho r/ 0 es cierta 


[cuando de hecho H 0 es falsa 


Si la decision es el rechazar a H 0 , entonces puede que se rechace algo que 
es cierto (decisidn incorrecta) o que se rechace algo que en realidad es falso (decision 


* La razdn de por que se ha usado la frase “equivocarse al rechazar H„" m4s que “aceptar H„' seri 
:v:dente mas adelante. 
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correcta). Si no se puede rechazar H 0 , entonces no puede rechazarse algo que es cier- 
to (decisibn correcta), o no puede rechazarse algo que en realidad es falso (decisibn 
incorrecta). Por lo tanto, si la decisi6n es rechazar o equivocarse al rechazar H 0 , 
existen dos posibilidades de tomaf una decisibfl equivocacfa'con respecto al verdade- 
ro estado de la naturaleza. ■ *<>••• " 

Cuando se toma una decisibn con respecto a una hip6tesis nula, dos de las po- 
sibles consecuencias relativas al verdadero estado de la naturaleza conducen a erro- 
res inferenciales. El rechazo de la hipdtesis H 0 cuando en realidad H 0 es cierta, 
constituye lo que se denomina error de tipo I. Equivocarse al rechazar H 0 cuando 
en realidad H 0 es falsa, constituye lo que se denomina error de tipo II. El lector 
debe notar que s61o es posible el error de tipo I cuando la decisibn es el rechazar la 
hipdtesis nula, mientras que el error de tipo II sdlo es posible cuando la dedsidn es el 
no rechazar H Q . En otras palabras, si la hipdtesis nula realmente es cierta, sdlo 
puede cometerse un error de tipo I; si la hipdtesis nula es falsa, sdlo puede cometerse 
un error de tipo II. No pueden cometerse ambos errores en forma simult&nea. De 
manera obvia, el interes recae en la posiblidad de cometer un tipo, cualquiera, de 
error. Sin embargo, es importante comprender que una decisidn con respecto a una 
hipdtesis estadistica es un proceso inferencial, el cual siempre se encuentra sujeto a 
error. La decisidn de rechazar H 0 no necesariamente significa que H 0 sea falsa; 
pero la evidencia muestral con base en la cual se toma la decisidn proporciona un 
grado de confiabilidad (paralelo al de la estimacidn de intervalo) con el que puede 
procederse como si H 0 fuese falsa. 

Es necesario tener alguna cantidad que mida la posibilidad de cometer alguno de 
estos errores. Esta medida es una probabilidad. 

Definicidn 9.1 La probabilidad de rechazar H 0 , dado que H 0 es cierta, se define 
como la probabilidad (o tamaflo) del error de tipo I y se denota por a, 0 a =£ 1. 

Definicidn 9.2 La probabilidad de no rechazar H 0 , dado que H 0 es falsa, se define 
como la probabilidad (o tamaflo) del error de tipo II y se denota por/3, 0 0 « 1 

Por lo tanto, las probabilidades de los errores de tipo I y tipo II estan dadas por 
las proposiciones 

/’(rechazar H 0 \ H 0 es cierta) = a (9.1) 

y 

/’(no poder rechazar H u | H 0 es falsa) = /3. (9.2) 

Notese que tanto a como fi son probabilidades condicionales. No pueden obte- 
nerse las probabilidades de los errores de tipo I y tipo II en un sentido absoluto, de- 
bido a que el estado de la naturaleza no es conocido. Mas bien, puede calcularse la 
probabilidad a de rechazar //„ solo si se asume que H 0 es cierta, o la probabilidad fi 
de equivocarse el rechazar H 0 , si se asume que H 0 es falsa. 

Cuando una afirmacibn se incorpora en la proposicibn de la hipbtesis nula, se ne- 
cesita una regia que indique que decisibn tomar con respecto a H 0 una vez que se en- 
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cuentra disponible la evidencia muestral. Esta regia recibe el nombre de prueba de 
una hipdtesis estadistica,, ,•> 



Definicidn9,3 Una prueba de una hipdtesisestadistica con respecto. a alguna ca- 
racteristica desconocida de la poblacidn de interfes es cualquier regia para decidir si 
se rechaza la hipdtesis nula con base en una muestra aleatoria de la poblacidn. 


La decisidn se basa en alguna estadistica apropiada la cual recibe el nombre de 
estadistica de prueba. Para ciertos valores de la estadistica de prueba, la decisidn 
sera el rechazar la hipdtesis nula. Estos valores constituyen lo que se conoce como la 
regidn crttica de la prueba. Por ejemplo, recuferdese la hipdtesis nula H 0 : p. = 10. 
Para un tamaflo n dado de la muestra, supdngase que se decide rechazar H„ si se ob- 
serva un valor de la media muestral X que sea mas grande que 12. Entonces, X es 
la estadistica de prueba, el valor X = 12 es el valor critico, y el conjunto de valores 
mayores que 12 , 'on rt ituyen la regidn critica de la prueba. 

Para mostrar en forma grbfica la regidn critica, supdngase que n es sufidente- 
mente grande de manera tal que la distribuddn de muestreo de la estadistica de 
prueba X , dado que H 0 es derta, es esencialmente una distribucidn normal. La fi- 
gura 9.1 muestra la regidn critica como el brea sombreada a la derecha del valor 
critico A" = 12. El &rea de la regidn critica es igual al tamaflo del error de tipo I. En 
otras palabras, P(X > 12|yu. = 10) = a. La interpretacidn de a es analoga a lade 
Ids intervalosjle confianza. Esto es, la prpbabilidad a es sdlo una referenda con respecto 
a la regidn X > 12 involucrando a la variable aleatoria X, dado que p. = 10. 
Pero la decisidn de rechazar H 0 se tomarb con base en una sola muestra de tamaflo 
n, a partir de la cual se calculara el estimador de x. De esta forma, si Jc > 12, 
esto no significa que la probabilidad de que H 0 sea correcta es a; mbs bien, esto 
implica una interpretacidn de frecuencia para a cuando se toman muchas muestras. 
En otras palabras, si el valor de p es realmente 10, y si se tomasen en forma repetida 
muestras de tamaflo n de la pobladdn, debe esperarse que en un 100«% de las veces, 
se encuentre un valor de la estadistica de prueba X mayor que 12, y de esta forma debe 



FIGURA 9.1 La region critica como un area 
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rechazarse la hip6tesis nula. S61o erreste sentido puede decirse que la confiabilidad 
al rechazar H 0 , cuando el estimador X > 12 es igual al complemento del error a de tipo 
I, O I —a.\ 1 •>:*. ... :• »> 

Para construir una regia de decisidn apropiada en la prueba de una hip6tesis> 
estadistica, tambifcn es necesario establecer una hipdtesis altemativa que refleje el 
valor posible o intervalo de valores del parimetro de inter&s si la hipdtesisnula es 
falsa. Esto es, la hipdtesis altemativa representa alguna forma de negaddn de la hi¬ 
pdtesis nula. Generalmente la hipdtesis altemativa se representa por //, y puede ser 
simple o compuesta. A pesar de que no se pretende una generalizaddn, en muchas 
ocasiones es deseable establecer una hipdtesis nula que sea mis espedfica que la al- 
ternativa. De esta manera, la hipdtesis nula es simple en forma general, mientras que 
la altemativa es una hipdtesis compuesta. Por ejemplo, supdngase que el gerente 
de la planta sospecha que el tiempo de armado promedio es mayor de 10 minutos. 
Entonces las hipdtesis nula y altemativa apropiadas podrian ser 

//„: M = 10, 

H,:p> 10. 

La razdn de ello es que si la evidencia muestral no apoya el rechazo de la hipdtesis 
nula, entonces el gerente de la planta podria proceder como si H a fuese cierta. De otra 
manera, la sospecha podria justificarse y entonces puede ser necesario emprender al- 
guna accidn para corregir la falla. 

De acuerdo con la definicidn 9.3, el procedimiento de prueba se construye de ma¬ 
nera tal que la hipdtesis nula sea o no rechazada. En este sentido, se dice que H 0 es 
la hipdtesis a ser probada. Sin embargo, con la inclusion de la hipdtesis altemativa, 
puede ser mis descriptivo decir que probar una hipdtesis estadistica es proporcionar 
una decision entre H 0 y H v Por ello debe ejercerse una precaucidn extrema al es¬ 
tablecer las hipdtesis nula y altemativa. 

Se regresari a la analogia del proceso judicial para proporcionar una idea mis 
clara sobre la materia. Si la hipdtesis nula es “inocente”, entonces, con toda seguri- 
dad, la hipdtesis altemativa es “culpable”. El rechazo de la hipdtesis nula implicaria 
que el juicio ha sido capaz de proporcionar suficiente evidencia para garantizar un 
veredicto de culpable. Por otro lado, si el juicio no presenta evidencia sustancial, el ve¬ 
redicto seri inocente. Esta decision no implica necesariamente que el acusado sea 
inocente, mis bien hace enfasis en la falta de evidencia sustancial necesaria para 
condenar al acusado. Por lo tanto, en cierto sentido un veredicto de culpable (el 
rechazo de H 0 ) debe considerarse como una decisidn mis fuerte que un veredicto 
de inocente (equivocation al rechazar //„), lo cual surge del principio judicial general¬ 
mente aceptado de que es peor condenar a una persona inocente que dejar ir a una 
culpable. Si el veredicto es culpable, se desea tener un grado muy alto de seguridad 
de que no se va a condenar a una persona inocente. Por lo tanto, en muchas si- 
tuaciones el error de tipo I se considera como un error mucho mis grave que el error 
de tipo II. 

En la prueba de hipdtesis estadisticas el enfoque general es aceptar la premisa 
de que el error de tipo I es mucho mis serio que el error de tipo II, y formular las hi- 
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p6tesis nula y altemativa de acuerdo con lo anterior. Como resultado se dene que 
muchas veces se selecciona con anticipaci6n el tamaflo maximo del error de dpo I j 
que puede tolerarse y se intenta construir un procedimiento de prueba que minimice | 

el tamaflo del error de tipo II. En otras palabras, no es posible fijar tanto a a como a % 

P y diseflar alguna regia de decisibn para probar H 0 contra H x , dada uriamuestra | 
aleatoria de tamaflo n. Es por esta raz6n que se dice “equivocacibn al rechazar H 0 ” 
mbs que “aceptar H 0 ” cuando la evidencia muestral no apoya el rechazo de la hip6- 
tesis nula. "• •■■■■?. 

Un principio sencillo y razonable al obtener reglas de decisibn para la prueba de 
hipbtesis estadisticas es seleccionar aquel procedimiento de prueba que tenga el ta¬ 
maflo mbs pequeflo para el error de tipo II entre todos los procedimientos que ten- 
gan el mismo tamaflo para el error de tipo I. En este contexto debe notarse que el va¬ 
lor de a no puede hacerse muy pequeflo sin que se incremente el valor de p. En otras 
palabras, para una muestra de tamaflo n dado, el tamaflo del error de tipo II nor- 
malmente aumentara conforme el tamaflo del error de tipo I disminuya. Lo qm, en 
forma general, se hace en la prbctica, es ajustar el tamaflo del error de tipo I cambiando 
el valor critico de la estadistica de prueba para asi alcanzar un balance satisfactorio entre 
los tamaflos de los dos errores. Sin embargo, cuando se hace esto debe tenerse en mente 
el maximo tamaflo del error de tipo I que puede tolerarse en una situacibn en particular. 

Por ejemplo, recuerdesede nuevo la hipbtesis nula H 0 : n - 10 contra la hipbtesis 
altemativa H x : n> 10. Entonces P es igual a la probabilidad de equivocarse al 
rechazar H 0 cuando //, es cierta. Al igual que antes, sea X la estadistica de prueba. 

La figura 9.2 muestra como, mediante el cambio del valor critico de 12 a 11, el tama¬ 
flo de error de tipo I disminuye (este se encuentra por debajo de la curva que estb a la 
izquierda en ambos casos), pero crece el tamaflo del error de tipo II (este se muestra 
bajo la curva que se encuentra a la derecha en ambos casos). 

La probabilidad a del error de tipo I tambien se conoce como el nivel de signifi- 
cancia estadistico. En este contexto la palabra “significancia” sblo implica que la 


/(Jltfo) fix \ Hi) f(x | H 0 ) fix | HO 



FIGURA 9.2 El efecto sobre a y /3 al cambiar el valor critico 
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evidencia muestral es tal que garantiza et rechazo de H 0 a un nivel dado de a. En 
consecuencia, la frase “El rechazo de H 0 es estadlsticamente discernible a un nivel 
dado 6t”, es mis apropiada, Un ejemplo ilustrari los conceptos anteriores. 

Ejemplo 9.1 Sup6ngase que puede tolerarse un tamaflo del error de tipo I hasta de 
0.06 cuando se prueba la hip6tesis nula 

H 0 : p. = 10 

contra la hipdtesis alternativa 

H i :p> 10 

para el problema del tiempo de armado. Supdngase que la distribucion del tiempo 
necesario para armar una unidad es normal con desviacidn estandar a = 1.4 minu- 
tos. Se observan los tiempos de armado de 25 unidades seleccionadas aleatoriamente 
y escoge la media muestral X como la estadistica de prueba. En particular, se desea 
comparar las siguientes regiones criticas. 

Prueba A: Rechazar H 0 si X > 10.65 

Prueba B: Rechazar H 0 si X > 10.45 

Prueba C: Rechazar H 0 si ^ > 10.25 

para determinar cual de estas satisface el tamaflo del error de tipo I que puede tole¬ 
rarse y cual tiene el valor mas pequefto de fi entre las tres. 

Para determinar la probabilidad del error de tipo I, se asumira que H 0 es cierta y 
se calculara 

P(X > c | p = 10) = a, 

en donde c es el valor critico, o frontera de la region critica. Ya que se asume que el 
muestreosellevaacabosobreunadistribuddnnormal,bajo H 0 , X ~ N( 10, 1.4/\/25). 
Por lo tanto, para la prueba A 

a = P(X > 10.65 j p = 10) 

= P[Z > (10.65 - 10)/0.28 \p = 10] 

= P(Z > 2.32 \p = 10) 

= 0 . 0102 . 

De manera similar, para la prueba B 

a = P(X> 10.45 \fi = 10) = P(Z > 1.61 | p = 10) = 0.0537, 

y para la prueba C 

\ 

a = P(X> 10.25 |/i = 10) = P(Z > 0.89 | p. = 10) = 0.1867. 
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N6tese que el tamaflo del error de tipo I para la prueba C es mayor al limite impues- 
to de 0.06, mientras que para las pruebas A y B, este es menor que el limite dado. 
Puesto que>,C no ,reune.los requisites, no sera ya considerada. 
v Ya que ni la prueba A ni la B han violado el tamaflo mctximo del error de tipo I, se 
determinant cuSl de estas dos tiene el tamaflo m4s pequeflo para el error detipo II. 
Recuerdese que la ocyrrencia de un error de tipo II implica que H a es falsa. Enton- 
ces, para un tamaflo de la muestra y un valor m&ximo de a dados, el tamaflo del 
error del tipo II serit, en forma estricta, una funci6n del intervalo de valores del pa- 
r&metro desconocido como se encuentran especificados en la hipdtesis alternativa. 
En otra palabras 

p(p) = P(X^c\p> 10). 

En particular, supdngase que el valor real dey.es igual a 10.4. Entonces, para la 
prueba A 

0(10.4) = P(X ^ 10.65 I fi = 10.4) = P(Z ^ 0.891 y = 10.4) = 0.8133, 
mientras que para la prueba B 

♦ 

0(10.4) = P(X 10.45 | fi = 10.4) = P(Z =£ 0.18 | y = 10.4) = 0.5714. 

De esta forma, si y =» 10.4, la probabilidad de que la prueba A se equivoque al 
rechazar la hipdtesis nula de que y = 10 es de 0.8133, y la correspondiente proba¬ 
bilidad para la prueba B es de 0.5714. Para este valor particular de la hipdtesis alter¬ 
nativa, la prueba B es mejor que la A. 

Al ilustrar el intervalo de valores de las probabilidades 0 para estas dos pruebas, 
se continua el proceso de calcular el tamaflo del error de tipo II para otros valores 
representatives. En la tabla 9.1 se da la informacidn pertinente. Posteriormente se 
ilustrara que para una hipdtesis alternativa dada y un tamaflo fijo del error de tipo I, 
puede reducirse el tamaflo del error de tipo II mediante el incremento del tamaflo de 
la muestra. 

Con base en la informacidn proporcionada en la tabla 9.1, pueden formularse las 
siguientes observaciones. Conforme el tamaflo del error de tipo I disminuye (prueba 
A), el tamaflo del error de tipo II aumenta. Si la afirmacion propuesta por la hipdte¬ 
sis nula es falsa pero difiere muy poco del verdadero valor, la option de no rechazar 
H 0 es alta. Sin embargo, si la hipdtesis nula es falsa por una cantidad muy grande, 
la probabilidad de equivocarse al detectar su falsedad es pequefia. De esta forma, al 
comparar las pruebas A y B, si puede tolerarse un tamaflo del error de tipo I hasta de 
0.06, entonces la prueba B es mejor que la A debido a que sus probabilidades 0 son, 
de manera uniforme, mas pequeflas que las de la prueba A. 

oc: 


TABLA 9.1 Probabilidades para el error de tipo II para las pruebas A y B 


p 

10.2 

10.4 

10.6 

10.8 

11.0 

11.2 

11.4 

Prueba A 
Prueba B 

0.9463 

0.8133 

0.8133 

0.5714 

0.5714 

0.2946 
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9.3 Tipos de regiones criticas y la funcion de potencfatK&'..UAlfAt 

Con anterioridad se sugirib que es deseabie estabiecer una hipbtesis nula simple. De 
hecho, tambien es deseabie estabiecer una hip6tesis altemativa simple ya que s61o en este 
caso es posible determinar valores unices de los tamaflos de los errores'tipb I ytipblD 
Con el prop6sito de ilustrar lo anterior, recuerdese el ejemplo 9.1. Supbngase que'para 
este tambien se ha formulado la siguiente hip»6tesis altemativa H,: fi = 10.8. En- 
tonces para las pruebas A y B, los tamaflos de los errores de tipo I permanecer&n en 
0.0102 y 0.0537, respectivamente. Pero en este caso la probabilidad del error de tipo 
II para cualquiera de las pruebas tendril un solo valor mas que un intervalo de valo¬ 
res, como en el ejemplo 9.1. Sin embargo, debe notar se que una hip6tesis altemativa 
simple puede tener una aplicacion real limitada. De acuerdo con lo anterior, se pro- 
cedera bajo la hipbtesis de que la hip6tesis nula es simple y la altemativa compuesta. 

En este contexto se desean estudiar lbs tipos de regiones criticas que pueden sur- 
gir. Considerese la hipbtesis nula simple. 

H 0 : 9 = 9o 

con respecto al par&metro de interes 0, cuando se muestrea una distribucibn cuya 
funcibn de densidad de probabilidad es /(jc; 0), en donde 9$ es el valor pro- 
puesto de 9. Si la hipbtesis altemativa es de la forma. 

H, : 0 > 0 O 
o 

H |: 6 < 00, 

Se dice que H, es una hipdtesis altemativa unilateral, debido a que los posibles valo¬ 
res de 0 bajo H x se encuentran a un lado del valor propuesto bajo //„. La regibn 
critica tambien recibe el nombre de regibn de rechazo unilateral debido a que es, 
en forma intuitiva, razonable rechazar H 0 para los valores de una estadistica de 
prueba apropiada que, si H 0 fuese cierta, son extremos en la direccibn que especifi- 
ca la hipbtesis altemativa. Vale la pena notar que la hipbtesis altemativa debe for- 
mularse sblo si el valor de uno de los parametros que se encuentre en el lado opuesto, 
no tiene sentido para el investigador. De otro modo, debe establecerse una hipdtesis 
altemativa bilateral. Esto es, si la hipbtesis altemativa no proporciona una direccibn 
con respecto al valor propuesto de 0 O , entonces se dice que ff, es una hipbtesis alter- 
nativa bilateral de la forma 

H,:9 + 0 O . 

Una hipbtesis altemativa bilateral implica la existencia de una regibn critica 
bilateral* ya que //, incluye valores de 9 que se encuentran a ambos lados del valor 
propuesto de 0 O . Para este caso, la decisibn se inclina a rechazar la hipbtesis nula 
para aquellos valores de la estadistica de prueba que, si H 0 fuese cierta, son extre¬ 
mos en cualquier direccibn. 

* En for mil general, una region critica bilateral es sim6trica; las dos partes de la regibn se seleccionan de 
tal manera que el Area bajo cada una de las regiones sea igual. 
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TABLA 9.2 Potencias de las'pruebas A y B para el ejemplo 9.1 * 1i > 



10.2 

10.4 

; i. 10.6 

10.8 

11.0 

• k "2 .. 

11.4 

Prueba A 

0.0537 

0.1867 0.4286 jh 

0.7054 

0.8944 

! v 0.9750 - 

0.9963 

Prueba B 

0.1867 

0.4286 

0.7054 

0.8944 

0.9750 

0.9963 

0.9997 




Si se asume una hip6tesis altemativa compuesta, es necesario generalizar los me- 
dios por los cuales se puede evaluar la interpretaci6n de una prueba dada, en forma 
especial cuando se compara esta con otras pruebas. Como se ilustra en el ejemplo 
9.1, el tamaflo del error de tipo II varia para los diferentes valores de 0 de la hipote- 
sis altemativa cuando //, es compuesta. De esta forma el tamaflo del error d64ipolf> 
se obtiene como una funcibn de los valores alternativos de 0 bajo H { . Debe notarse 
que 1 3(0) se conoce como la funcidn caracterlstica de operacidn, y cuando se grafica 
/3(0) para diversos valores de 0 de //,, se obtiene una curva caracterlstica de opera- 
ci6n (CO). 

Dado que 13(6) es la probabilidad de que un valor de la estadistica de prueba no 
se encuentre en la regibn critica cuando H 0 es falsa, entonces 1 - (3(0) representa la 
probabilidad de que un valor de la estadistica de prueba se encuentre dentro de la re¬ 
gion critica cuando H 0 es falsa. Esta probabilidad se conoce como la funcidn poten- 
cia de la prueba. En otras palabras, las funciones potencia y caracteristicas de opera- 
cibn son complementarias. 

Definion9.4 La funcibn P(8) = 1 - (3(6) recibe el nombre de funcibn potencia y 
representa la probabilidad de rechazar la hipbtesis nula cuando esta es falsa; es de- 
cir, cuando el valor del par&metro de //, es cierto.* 


En esencia, la potencia de una prueba es la probabilidad de detectar que H 0 es, 
en forma verdadera, falsa; de aqui el uso de la palabra “potencia”. Como ilustra- 
cion, recuerdese el ejemplo 9.1. Los complementos de las probabilidades de los ftrro- 
res de tipo II que se encuentran en la tabla 9.1 son las potencias de las pruebas A y B 
para los valores indicados dep. cuando se prueba H 0 : p. = 10 contra//,: p. > 10. 
Estos valores se encuentran en la tabla 9.2. De esta informacibn, es evidente que la 
prueba B es mas poderosa que la prueba A. Pueden graficarse las funciones caracte¬ 
risticas y de potencia de las pruebas A y B contra los valores de /a. dando las curvas 
caracteristicas de operacibn y de potencia que se ilustran en la figura 9.3. 

Recuerdese que para un a fijo y una hipbtesis altemativa dada, puede disminuir- 
se el tamaflo del error de tipo II si se incrementa el tamaflo de la muestra. Por lo tan- 
to, se desprende que la funcibn de potencia aumentara conforme aumenta el tamaflo 
de la muestra. Como ilustracion, considerense las pruebas A y B del ejemplo 9.1 
para las que el tamaflo de la muestra se aumenta hasta un valor de 50. Dado que 
se insiste que los tamafios del error de tipo I siguen siendo los mismos para las 


Si H„ es cierta, algunos autores definen la potencia para ser igual al tamaflo del error de tipo i. 
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a) Curva de potencia b) Curva CO 


FIGURA 9.3 Comparacion de las funciones pqtencia y caracteristica de operaci6n para A y B 


pruebas A y B, sus valores criticos pueden disminuir de valor debido al incremento 
en el tamaflo de la muestra. En particular, pra la prueba A 

P0C >c A \p = 10) = 0.0102, 

o 

- - --- = = 2.32, 

1.4/V50 

c A = 10.46. 

De manera similar, para la prueba B 

P(X > c B | /r. = 10) = 0.0537, 

y c B = 10.32. La tabla 9.3 contiene informacion comparable con la de las tablas 9.1 
y 9.2 para n = 50. 

Tambien puede mostrarse la potencia para diferentes valores de p relativos a la 
distribution de muestreo de la estadistica X. Considerese, por ejemplo, la prueba B, 


TABLA 9.3 Potencias y probabilidades (3 de las pruebas A y B para n = 50 




10.2 

10.4 

10.6 

10.8 

11.0 

11.2 

11.4 

Prueba A 

Pip)' 

0.0951 

0.3821 

0.7611 

0.9573 

0.9968 

0.9999 

= 1 



0.9049 

0.6179 

0.2389 

0.0427 

0.0032 

0.0001 

= 0 

Prueba B 

/V) 

0.2709 

0.6554 

0.9207 

0.9922 

0.9997 

= 1 

= 1 


/3<m) 

0.7291 

0.3446 

0.0793 

0.0078 

0.0003 

= 0 

- 0 
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FIGURA 9.4 Probabilidades de rechazo de H t) para la prueba B (« = 50) 


en la que el valor critico es c B = 10.32 paran = 50. La figura 9.4 muesra la distri- 
bucion de X para distintos valores de p. > 10, en donde el area sombreada es la po- 
tencia o la probabilidad de rechazar H u . Notese que conforme el valor de /x se aleja 
del valor propuesto bajo H 0 , la potencia de la prueba aumenta. 


9.4 Las mejores pruebas 

En la ultima seccion se determino que la evaluacion de la prueba de una hipotesis 
estadistica debe hacerse con base en su funcion de potencia. En esta seccion se regre- 
sara al problema igualmente importante de como construir una buena prueba. En un 
sentido teorico, el metodo para construir buenas pruebas es mas claro cuando tanto 
las hipotesis nula y altemativa son simples o cuando ambas son cumpuestas. En este 
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punto, sic considerarb un teorema para construir las mejores pruebas en el caso sen- 
cillo de H 0 contra H\. Este teorema tambien tiene alguna aplicacibn en casos mbs 

prbcticos.: r V . s 

Sea X u X 2 X n una muestra aleatoria de tamaflo n de una poblacibn cuya 
funcibn (densidad) de probabilidad es f(x; 0), y considerese la hipbtesis 

- ~ H o :0 = 0 o 

contra 

„ H\' 0 = 0 \, 

en donde se especifican 0 O y 0,. Supongase que a es el tamaflo maximo del error de 
tipo I que se puede tolerar. Entonces la mejor prueba para H 0 contra //, es aquella 
que tiene el tamaflo mas pequefto del error de tipo II (y de esta forma la mayor po¬ 
tential de entre todas las pruebas que tengan un tamaflo del error de tipo I no mayor 
que a. Se pueden determinar las regiones criticas para estas pruebas inediante el uso 
del siguiente teorema, el cual se conoce como lema de Neyman-Pearson: 


Teorema 9.1 Si existe una region critica C de tamaflo a y una constante positiva k 
tal que 


Eq(x, , x 2 . x „; 0 U ) 

£|C*1, *2.0,) 

Eq(X|, x 2 , •••, x„; 0 O ) 
E,(x, ? x 2 . x„; 0,) 


k 

k 


interior C , 


exterior C, 


entonces C es la mejor region critica de tamaflo a para probar //„: 0 = 0 O contra 
//,: 0 = 0,, en donde £„ y L, son las funciones de verosimilitud relativa a H 0 y //,, 
respectivamente. 


La demostracibn del teorema 9.1 se encuentra mas allb del alcance de este iibro. 
Sin embargo, puede aclararse la utilidad de este teorema mediante los siguientes 
ejemplos. 


Ejemplo 9.2 Sea A 1 ,, X 2 , .... X n una muestra aleatoria de tamaflo n de una distri¬ 
bution normal con media p desconocida y varianza a 2 conocida. Determinar la me¬ 
jor region critica de tamaflo a para probar 


contra 


//„: p = Mo 
H\- P = P\, 


en donde p, > po- 

Bajo H 0 la funcion de verosimilitud es 


L 0 (xi , x 2 . x n \ po) = (y/2 no-) " exp 


X (*i - M <>) 2 

i=i 
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y bajo //, esta es ■ ^ . 

L\(x \, x 2 , ..., x „; ft,) = (V27T a)”" expj^ - X U “ Mi) 2 y^2<r 2 

Entonces, de acuerdo con el teorema 9.1, la mejor regi6n critica es aquella para la 
cual 

exp - XU - Mo)72o - 2 
exp -XU - Mi) 2 /2cr 2 

Esta desigualdad puede escribirse como 

exp {5? 

la cual, despues de tomar los logaritmos, se reduce a 

XU - Mi) 2 - XU - Mo) 2 ^ 2o- 2 ln(fc). (9.4) 

El lado izquierdo de (9.4) se simplifica de la siguiente manera: 

Xu - Ml) 2 - Xu - Mo) 2 = XU - 2miX*, + "Mi - XU + 2moX*. “ "Mo 

= - Mo) - 2(/x, - Mo)X*i- 

Sustituyendo en (9.4) se tiene 

"(Mi - Mo) - 2 (mi - Mo)X*< *= 2o- 2 ln(fc), 
o 

-2(mi - Mo)X*, *= 2cr 2 In(A:) - nip?, - pi). 

Puesto que Mi > p 0 , la cantidad — 2(p, - p 0 ) es negativa; as! que 


XU - Mi ) 2 - XU - Mo ) 2 | 





n(p] - Mo) ~ 2cr 2 ln(A) 
2(Mi “ Mo) 


k(Mi ~ Mo) ~ 2o- : ln(A:) 
2//( Mi “ Mo) 


La expresion (9.5) define la forma de la mejor region critica para probar H 0 : p 
= Mo contra //,: p = p t en donde Mi > Mo- De manera sencilla, la mejor re¬ 
gion critica es el extremo derecho de la distribution de muestreo de X bajo la hipote- 
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sis nula. Para un a dado, el valor critico x Q puede.encontrarse mediante una 
elecci6n apropiada de la constante positiva K, de manera tal que : . : 

; , .. :0 - , P (X 35 *ol M = Mo) = «• , , / 2 j. p:ni . if,;-,!') 

En particular, sup6ngase que se escoge un tamaflo del error de tipo I igual a 0.05. 
Entonces el valor critico de J 0 es tal que \ 

PiX^x 0 \n = Mo) = 0.05. 

Ya que bajo H 0 , X tiene una distribution normal con media Mo y desviacidn estkn- 
dar o-/ \/n, entonces O ^ i ^ 

YyO'-O CU_ <&V«W/ t v 


pero 




P(Z3= 1.645 | m = mo) = 0.05, 


Ov 

. m r ( r 


en donde Z ~ M0, 1). De acuerdo con lo anterior, el valor critico de jc 0 es tal que: 



\ ^ 

\,' — 
h . 




*o Mo 
<r/\/n 


1.645, 


1.645o- 

Xo i— 4 Mo * 

yn 


Por lo tanto, se rechazara a H 0 : m = Mo en favor de //,: m = Mi > Mo cada vez 
que un valor de X sea> (1.6 45o-/\fn) + Mo- 

Es importante que el lector note que la forma de la mejor region critica, como 
estadada por (9.5), para probar H 0 : m = Mo contra //,: m = Mi es independiente 
del valor de mi siempre que Mi > Mo- En otras palabras, para toda mi > Mo la 
mejor region critica en la prueba de H 0 : m = Mo es el extremo derecho de la dis¬ 
tribucion de muestreo de X. Asi, la expresion (9.5) en realidad da la forma de la me¬ 
jor region para probar la hipotesis nula simple H 0 : m = Mo contra la hipotesis 
alternativa compuesta H\. p > Mo- Esta mejor region critica recibe el nombre de 
region (o prueba) uniformemente mas potente para pro bar H 0 : m = Mo contra 
M > Mo- Los comentarios anteriores seran generalizados con la siguiente defini¬ 
tion de la mejor prueba. 


Definition 9.5 Se dice que una prueba de la hipotesis H 0 : 8 = 8 0 es la prueba 
uniformemente mas potente de tamaflo a si esta es por lo menos tan poderosa, para 
cualquier valor posible 0 de la hipotesis alternativa, como cualquier otra prueba de 
tamaflo «a. Esto es, la funcion de potencia de esta prueba es, por lo menos, tan 
grande como lk de cualquier otra prueba de tamaflo s a para cualquier valor 0 de la 
hipotesis alternativa. 
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En forma desafortunada no siempre existen las pruebas uniformemente m4s po- 
tentes.Como se ilustrd en el ejemplo 9.2, se puede usar el lema de Neyman-Pearson 
para determinar la prueba uniformemente mas potente para cierto numero de situa- 
ciones de interes pr&ctico en las que la hipdtesis alternativa es compuesta pero unila¬ 
teral. -..'.Vi'.L.'j.i 

Ejemplo 9.3 Sea X u X 2 , .... X n una muestra aleatoria de tamaflo n de una 
distribucidn gama con parimetro de escala 9 desconocidos y pardmetro de forma 
a* Determinar la mejor regidn critica de tamaflo a para probar 

//„: 0 = 0„ i‘ 


contra 

H t :0 = 0„ 


en donde 0, < 9 0 


Se procedera en forma similar a la de! ejemplo 9.2. Bajo H 0 , la funcidn de verosi 
militud es 

x“i exp| 

y para la hipdtesis alternativa esta es 

x“ exp 

i= I 

Con base en el lema de Neyman-Pearson, la mejor region critica es aquella para la 
cual 


n 

L,(jr,, x 2 , .... x n ; 0,) = f] 



n 

L 0 (x\, x 2 , x n \ 6 q) = [r(n)fl 0 ] J”[ 



Esto es 






(tfo/e.r* 

(ejex'k 
Inf k(0 o /0,r). 


* Se ha optado por denotar el parametro de forma de la distribution gama con a en lugar de a para evitar 
confundir este con el tamaflo del error de tipo I. 
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Se observa que la cantidad 0 O - 6, es positiva ya que por hip6tesis d, < 9 a ; enton- 


ces 




e 0 d, In WJO,r] 


6 0 




A > -.0 




e 0 6, ln[*(0, 


n(6 0 - 9 ,) 


I j 6 r n 


De acuerdo con lo anterior, la mejor regi6n critica para probar // 0 : 0 = 0 O contra 
H { : 9 = 6] en donde 9, < 9 0 es el extremo izquierdo de la distribucibn de 
muestreo de X. El valor critico x 0 , para un tamafio dado del error de tipo I, es tal 
que: 

P(X < Jr 0 | 0 = 0 O ) = a, 

y puede encontrarse, en forma directa, de la distribucibn de X, la que en este caso 
tambien es una distribucion gama. Para hacer lo anterior es necesario utilizar la fun- 
cibn gama incompleta. De manera alternativa, si el tamafio de la muestra es lo sufi- 
cientemente grande, puede emplearse el teorema central del limite y usar entonces la 
aproximacibn normal. 

De nuevo, es interesante notar que la forma de la mejor region critica dada por 
(9.6) no depende del valor particular 9 siempre que 0, < 0 O . Por tanto, en realidad 
la regibn critica indicada por (9.6) es una regibn uniformemente mas potente para 
probar H 0 : 9 = contra H t : 9 < 9 U cuando se muestrea una distribucion gama 
con parametro de forma conocido. 

Se invita al lector a que compruebe que si, en el ejemplo 9.2, la hipbtesis alterna¬ 
tiva es de la forma H ,: /x < /xq , la mejor regibn critica para probar H n : p. = es 
el extremo izquierdo de la distribucion de X. Por lo tanto, se desprende que si en el 
ejemplo 9.3 la hipbtesis alternativa fuese H,: 9 > 0 O , la mejor regibn critica debe 
ser el extremo derecho de la distribucion de X. Sin embargo, si la hipbtesis altemati- 
va en cualquiera de estos dos ejemplos fuese bilateral (esto es, de la forma general 
H 0 : 9 = 0 O contra //,: 0 ^ 0 O ), no puede encontrarse ninguna regibn critica 
mejor, debido a que para todos los valores alternativos 0, < 0 o ,el extremo izquierdo 
de la distribucibn de X sera el mejor, mientras que para todos los valores 0, > 0 O es - 
el extremo derecho el que sera el mejor. Por lo tanto, como regia general, las 
pruebas uniformemente mas potentes usualmente existen para hipbtesis alternativas 
unilaterales, pero estas no pueden encontrarse para hipbtesis alternativas bilaterales. 

A continuacibn se ilustrara el uso del lema de Neyman-Pearson para determinar 
la mejor regibn critica cuando la variable aleatoria de interes es discreta. 

Ejemplo 9.4 Sea A',, X 2 , .... X„ una muestra aleatoria de tamafio n de una distri¬ 
bucion de Poisson con parametro X desconocido. Determinar la mejor regibn critica 
de tamafio a pafa probar 

H a '. X = X 0 
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contra ■ - 

H t : A = A,, 

donde > X«. 

A1 proceder de manera similar a la de los ejemplos 9.2 y 9.3, se tiene 

exp(-riX 0 ) xf 1 ' 


Lq(Xi, x 2 , ...» x „; A 0 ) — 


n*-! 


£i(*i. x 2 . x„; X,) = 


exp(-nX|) Xf*‘ 

TW 


De esta manera, la mejor regi6n critica es aquella para la cual 

exp(-nXo) Xf' . 


exp(-nX,) X 


x Zx, 




^ J exp[n(A, - X 0 )] k. 


Despues de tomar los logaritmos, se tiene 

ln(Xo/X|) *2jXj + n(A, - X 0 ) ln(£) 


o 

ln(X 0 /X,)X^ $ ln(X) — n(A, - X 0 ). 

Pero si X, > X 0 , entonces 0 < A 0 /A, < 1 y el logaritmo natural de un numero 
entre 0 y 1 es negativo. Esto da como resultado que la desigualdad anterior pueda es- 
cribirse como 


y r > ln(X) n(X| X„) 

^ ' " ln(X u /X|) • } 

La expresion (9.7) define la forma de la mejor region critica para probar H 0 : X = X 0 
contra//,: X = X, > X 0 . En particular, dado que Y = SA', tambien es una variable 
aleatoria de Poisson (veanse los ejercicios en el capitulo 7), la region critica de la for¬ 
ma y = 2 jc, ss y 0 esequivalente a la desigualdad (9.7), en donde el valor criticoy 0 
se escoge de manera tal que 


P(Y>y 0 ) = a. 

Debido a que Y es una variable aleatoria discreta, es m&s dificil determinar el valor 
eritico de y 0 de manera tal que P(Y 5* y 0 ) sea exactamente igual al tamaiio del error 
de tipo 1 previamente seleccionado. Para salvar esta dificultad puede implementarse lo 
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que se conoce como procedimiento do aleatorizaci6n (vease [2]). Desde un punto de 
vista pr&ctico, simplemente se. escoge.la;regibn critica y:el valor de cuya brea 
deberb ser lo mis cercana al'tamaflo del error de tipo I que;puede tolerarse. • t 

" - •' *• ' ' • ' - >e > .•■ -;i,w 

N V" y.'. .. 

9.5 Principios generates para probar una H 0 simple contra una //, 
uni o bilateral 

En la ultima seccibn se desarrollb uri criterio con el cual se pueden determinar las 
mejores pruebas para probar hip6tesis estadisticas. Se mencion6 que no existen 
pruebas uniformemente mas potentes para hip6tesis alternativas bilaterales a pesar 
de que, en forma usual, existen para hipbtesis alternativas unilaterales. En esta sec- 
ci6n se desarrollarin criterios generates de prueba para los siguientes tres casos los 
cuales involucran hipbtesis nulas simples y alternativas compuestas. 

Caso 1 _ Caso 2 _ Caso 3 

Mq9 = 6q Hq0 — 6q H(,\ 9 — Oq 
H,:9=/=9 o H ] :9>9 0 H,:6< 9 0 

Dado que para el caso 1 no pueden determinarse pruebas uniformemente mas poten¬ 
tes, para tipificar este se desea comparar las funciones de potencia de dos pruebas 
para un ejemplo espetifico. 

Ejemplo 9.5 Supbngase que en cierta ciudad s61o hay dos estaciones de televisibn: 
el canal 6 y el canal 10. Se piensa que para las noticias de la tarde el auditorio se en- 
cuentra dividido en partes iguales para ambos canales. Una compaflia se interesa en 
probar la afirmacibn de que la proporcibn de televidentes para las noticias de la 
tarde es igual a 0.5 para ambos canales. La compaflia no posee ninguna information 
a priori para sugerir una alternativa unilateral por lo que decide probar la hipbtesis 
nula 

H 0 : p - 0.5 

contra 

H,:p * 0.5. 

La compaflia encuesta a 18 residentes seleccionados al azar y pregunta que canal pre- 
fieren para ver las noticias de la tarde. El numero X indica que el canal 6 es el que 
se ha seleccionado. Se proponen las siguientes dos pruebas: 

Prueba A: Rechazar H 0 si X « 4 o X 3= 14. 

Prueba B: Rechazar H 0 si X 5 o X == 13. 

Si la compaflia piensa tolerar un tamaflo mbximo de 0.1 para el error de tipo I, deter¬ 
minar la mejor prueba a emplear para decidir entrc //„ y 7/,. 
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La estadistica de prueba X es una variable aleatoria binomial con n = 18 y, bajo 
la hip6tesis nula, p = 0.5. Las regiones criticas para ambas pruebas son intuitiva- 
mente razonables ya que se rechazar& la hip6tesis nula para aquellos valores de X 
que se encuehtren cercanos a 0 o a 18. En otras palabras, si p fuese realmente igual a 
0.5, debe esperarse observar un valor de X cercano a 9. Entre m&s se aleje el valor 
observado del valor de 0, en cualquier direction, se tendril m&s evidenria para 
inclinarse a rechazar la hipOtesis nula. Esto surge del hecho de que cuando se 
prueban hipdtesis estadisticas, el pensamiento se basa estrictamente en la probabili- 
dad. Por ejemplo, si p fuese igual a 0.5, la probabilidad de que X tome un valor 
entre 6 y 12 incluyendo a estos valores es 

P{6 X =£ 12) = 0.9038. 

Por lo tanto, es poco probable que H 0 sea correcta cuando se realice un valor de X 
grande o pequefto. ue necho, la probabilidad para observar un valor grande o pe- 
quefio de X, dado que H 0 es cierta, es precisamente lo que se entiende por el tamaflo 
del error de tipo I. 

Para la prueba A, la probabilidad del error de tipo I es 
a A = P(X *£ 4 | /> = 0.5) + P(X s* 14 | /> = 0.5) 

= 0.0154 + 0.0154 
= 0.0308, 
y para la prueba B este es 

« B = P(X « 5 | p = 0.5) + P(X s* 13 | p = 0.5) = 0.0962. 

No es excesivo notar que las regiones criticas bilaterales son simetricas para ambas 
pruebas. Esto es lo mejor desde el punto de vista teorico y el procedimiento m<ts 
aceptado desde el punto de vista practico para el manejo de hipotesis alternativas bi¬ 
laterales. Ya que ambas pruebas tienen valores de a menores ai tamaflo maximo que 
puede tolerarse del error de tipo I, se compararfln sus funcion^s de potencia para 
decidir cual es la mejor de las dos. En la tabla 9.4 se dan las potencias de las pruebas 
A y B para distintos valores de p. 

TABLA 9.4 Funciones de potencia de las pruebas A y B 

p 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 

Prueba Am ^ 4) 0.9718 0.7164 0.3327 0.0942 0.0154 0.0013 =0 =0 =0 

P{X 3= 14) = 0 = 0 = 0 0.0013 0.0154 0.0942 0.3327 0.7164 0.9718 

_ Potencia 0.9718 0.7164 0.3327 0.0955 0.0308 0.0955 0.3327 0.7164 0.9718 

Prueba B P(X 5) 0.9936 0.8671 0.5344 0.2088 0.0481 0.0058 0.0003 = 0 =0 

m 3= 13) = 0 = 0 0.0003 0.0058 0.0481 0.2088 0.5344 0.8671 0.9936 

Potencia 0.9936 0.867! 0.5347 0.2146 0.0962 0.2146 0.5347 0.8671 0.9936 
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De la tab la se observa que para cualquier valor de p, la potencia de la prueba B es 
mayor que la de la prueba A. De acuerdo con lo anterior, la prueba B es unifbrme- 
mente mbs poderosa que la prueba A y es la mejor prueba a utilizar para probar las 
hipbtesis indicadas. En la figura 9.5 se dan las curvas de potencia para las pruebas A 
y B. Nbtese que en ambos casos las curvas de potencia crecen en forma sim&trica 
conforme los valores de p se alejan del valor propuesto para este bajo H 0 . Lo ante¬ 
rior es un comportamiento tipico de una funcibn de potencia para hipbtesis alterna- 
tivas bilaterales, siempre que la correspondiente regibn critica bilateral sea simetrica 


9.5.1 Principios generates para el caso 1 
Considerese la prueba de la hipbtesis nula 

H 0 : e = 0 O ' 

contra la alternativa 

\ 0 0 O , 

donde 6 0 es el valor propuesto de algun parbmetro 6 bajo H 0 . Dada una muestra 
aleatoria de tamaflo n de la distribucibn de interes, el procedimiento general para 
probar H 0 , es escoger el mejor estimador de 6 , T y rechazar H 0 cuando el estimado 



FIGURA 9.5 Comparacion de las funciones de potencia para A y B . 
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t obtenido de la muestra, es en forma “suficiente”, diferente del valor propuesto de 
0 O . Este procedimiento se basa en la noci6n de un evento raro, la cual ya se ha 
ilustrado en capitulos anted ores. Esto es, si el estimado t esjo sufidentemente dis- 
tinto del valor propuesto fy, entonces se ha observado un evento raro (yla hipbtesis 
nula es correcta), o se ha observado un valor de la estadistica que sugiere un valor d 
diferente del propuesto 0 O . Cuando el estimado t es en forma suficiente distinto de 
0 O . se asumir& la ultima posibilidad y se dejard el tamaflo del error de tipo I igual a 
la probabilidad del anterior. En particular, para un tamaflo preseleccionado a, del 
error de tipo I se obtiene una regibn critica bilateral en los extremos de la distribu- 
ci6n de muestreo de T, de manera tal que el area, en cualquier lado, mbs alia del va¬ 
lor critico es igual a a/2. Entonces se rechaza H 0 en favor de //, cuando el estima¬ 
do t se encuentra dentro de la regibn critica. Cuando el estimado t no se encuentra 
dentro de la regibn critica, no puede rechazarse la hipbtesis nula. De esta forma, 
cualquier diferencia con respecto al valor de 0 O se considera causada por la fluc- 
tuacibn en el muestreo del estimador T. 

Este enfoque es muy similar a la construccibn de un intervalo de confianza bila¬ 
teral para 0. Para cualquier valor propuesto de 0 O que se encuentre dentro de un in¬ 
tervalo de confianza del 100(1 - a)% para 0, H 0 no sera rechazada. Dado un 
intervalo de confianza del 100(1 - a)% para 0, solo los valores propuestos bajo 
H 0 que se encuentren fuera de este intervalo daran como resultado el rechazo de la 
hipbtesis,nula. En este contexto, es apropiado considerar a un intervalo de confianza 
como una proposicion mas general de inferencia estadistica para 0, ya que esta 
incluye a todos los posibles valores de 0 O que podrian no llevar al rechazo de la hipb¬ 
tesis nula. 


9.5.2. Principios generates para el caso 2 
Considerese la hipbtesis nula 


H 0 : 0 = 0 O 

contra la alternativa 

//,: 0 > 0 O . 

Para este caso al igual que para el caso tres, la naturaleza unilateral de la hipbtesis 
alternativa sugiere la existencia de alguna informacibn a priori la cual ayuda a defi- 
nir la direccion unilateral de //, en relacion con el valor propuesto de 0 O . El procedi¬ 
miento general para probar H 0 es de nuevo el escoger la mejor estadistica T de 0 y 
rechazar H 0 cuando el estimado t es en forma “suficiente” mayor que el valor 
propuesto 0 O La palabra “suficiente” implica que se tiene una tolerancia para la 
fluctuacibn en el muestreo del estimador T. Sin embargo, si lo que se obtiene de esta 
forma por medio de la muestra aleatoria se encuentra mas alia de esta tolerancia, 
H 0 sera rechazada. De esta forma, para un tamaflo a, del error de tipo I, la regibn 
critica se encuentra localizada en el extremo superior de la distribucion de muestreo 
de T y H 0 se rechaza si el estimado t no es menor que el valor critico. En la figura 
9.6 se ilustra la curva de potencia tipica para este caso. 
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FIGl/RA 9.6 Curva tipica de potencia para el caso 2 


9.5.3 Principios generates para el caso 3 
Para probar la hipotesis 

H 0 : 6 = 0 0 

contra 

H,:8<d 0 , 

el procedimiento general es rechazar a H 0 cada vez que el estimado t sea, en forma 
“suficiente”, menor que el valor propuesto 0 O . La region critica de tamaflo a se lo- 
caliza en el extremo inferior de la distribucibn de muestreo de Ten forma tal que el 
area a la izquierda del valor critico sea igual al tamaflo a del error de tipo I. Cual- 
quier valor t de la estadistica de prueba T que se encuentre en la region critica llevara 
al rechazo de H 0 . En la figura 9.7 se muestra la curva de potencia para este caso. 

Con respecto a la prueba de hipotesis estadisticas, el lector debe tomar nota de lo 
siguiente. Debido a que se coloca un gran enfasis en el tamaflo del error de tipo I ge- 
neralmente se formula la hipotesis nula en forma tal que esta se rechace si la eviden- 
cia experimental apoya esta decision. En otras palabras, lo que realmente se desea es 
concluir que la hipotesis alternativa es la correcta. De esta forma, cuando se prueban 
hipotesis estadisticas, se juega un papel parecido al de un fiscal en su intento de pro- 
porcionar la suficiente evidencia para rechazar la hipotesis nula. Los indicado es 
escoger el tamafio del error de tipo I antes de la determinacion de la muestra aleato- 
ria. Si se obtiene como resultado que la hipotesis nula no puede rechazarse con el va¬ 
lor escogido de a debe evitarse aumentar el tamaflo del error de tipo I con la idea de 
rechazar la hipbtesis nula. 

La discusibn anterior constituye el metodo clasico para probar hipotesis estadis¬ 
ticas. Se han dirigido algunas critics directas hacia este enfoque debido a que la de- 
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FIGURA 9.7 Curva tlpica de potencia para el caso 3 

cision final de rechazar o no una H 0 dada, es demasiado cortante y seca y no pro- 
porciona una medida real de que la decision sea correcta en terminos de la probabili- 
dad. Para esto lo que se ha sugerido es el calculo del llamado valor p. El valor p es la 
probabilidadd, dado que H 0 es cierta, de que la estadistica de prueba tome un valor 
mayor o igual que el calculado con base en la muestra aleatoria. Un valor p relativa- 
mente pequeflo puede sugerir que si H 0 es realmente cierta, el valor de la estadistica 
de prueba sea poco probable. Puede entonces optarse por rechazar H 0 debido a que 
esta decision tendra una alta probabilidad de ser correcta. 

Se recomienda el calculo del valor p acoplado con el enfoque clasico de escoger 
un tamafio del error de tipo I antes de la determinacibn de la muestra aleatoria. En¬ 
tonces, la decision de rechazar o no a H 0 puede basarse en una region critica de tama- 
ilo a, con el valor p proporcionando una medida real en terminos de la probabilidad 
de que la decision sea correcta. De acuerdo con lo anterior, se sugiere la siguiente 
regia: si el valor p es menor o igual a a, se rechaza H 0 ; de otra forma no puede fe- 
chazarse la hipdtesis nula. El calculo del valor p se ilustrarS en los ejemplos sub- 
secuentes de este capitulo. Debe notarse que muchos paquetes estadisticos para 
computadora, tales como SAS, SPSS, BMD y otros, imprimen el valor p para casi 
todas las situaciones en las que se involucra, de alguna manera, la prueba de hipote- 
sis estadlsticas. 


9.6 Prueba de hipotesis con respecto a las medias cuando se 
muestrean distribuciones normales 

En esta seccibn se estudiara la prueba de hipotesis sobre la media de una distribucion 
normal o las medias de dos distribuciones normales independientes. Se examinar&n 

www. FreeLibros. com 




9.6 Prueba de hipdtesis con respecto a las mSdkts gOQ 

los casos en los que los valores de las varianzas son tanto conocidos como no coiioci- 
dos. Se invita al lector a que consulte las secciones 8.4.1 a 8.4.3 para efectuar com- 


paraciones con los intervalos de confianza. . 

- - V --V> T* ’. ~ 

9.6.1 Pruebas para una muestra 

, r ■ U i. ., ». j 

■■ - f ■ • . ■ ... >\ . J ; ... .... .<. 

Sea X x X 2 , ..., X n una muestra aleatoria de una distribucibn normal con media m 
desconocida. En este caso el interes recae en probar uno de los siguientes conjuntos 
de hipbtesis con respecto a m- 

M = Mo // 0 : M = Mo 

H 0 : m = Mo 

H t : p ± fx „ //,: m > Mo 

H\- M < Mo 


Primero, sup6ngase que el valor de la varianza poblacional cr 2 es conocido. Enton- 
ces la estadistica de prueba es la media muestral X , misma que, bajo la hipdtesis 
nula, tiene una distribucibn normal con media Mo y desviacibn estandar ar/\Jn. La 
regibn critica ae tamafio a para la hipdtesis bilateral es de la forma 


Rechazar H 0 si < 


x ^ *1-0/2 

or 

X -•£ x a/2 , 


(9.8) 


donde x,_ a/2 y x a/2 son los valores cuantiles criticos de X de manera tal que 
P(X s= X|_„ /2 ) = a/2 and P(X < x a/2 ) = a/2. 

Dado que bajo H 0 , X ~ Nipo, cr/\'n), entonces en forma equivalente 


p { z ^^f)‘ an » P ( Z ‘W )'“ /2 

o 

_ X> ~«/2 ~ _ X a/2 ~ Mo 

^*1 -a/2 ~~ . /— y Za/2 ~ / /— » 

cr/Vn o-/V« 

en donde z, _„ /2 y z a / 2 son los correspondientes valores cuantiles de Z. Por lc> tanto, 
se sigue que H 0 debe rechazarse cuando un valor x de la media muestral X es tal 
que 


— O' Z I - a/2 — O' Z a n 

X 3=-7=-^ + Mo o *=£— y=- + Mo- 

Vfl V n 

De manera equivalente, se rechazara H 0 cuando 

Z^Z|-o /2 o z^z a/2 , 

donde z = (x - ix 0 )/(a/\/n) es el valor de la correspondiente normal estbndar al 
valor x de X. 
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Para la hipotesis alternativa unilateral //,: p > p 0 , la regidn critica de tamaflo 
a es el extremo derecho de la distribution de muestreo de X\ esta es de la forma 

Rechazar H 0 si X .v, _ a , (9.9) 

en donde es el valor cuantil de X, tal que P(X 3= x,_„) = a. En forma simi¬ 
lar, para la hipdtesis alternativa //,: p’< p t) , la region critica es de la forma 

Rechazar //„ si X « x a , (9.10) 

en donde el valor x a es tal que P(X x„) = a. 

En la figura 9.8 se ilustran las regiones criticas para las hipotesis unilaterales en 
terminos de la estadistica X y su transformacion a la variable aleatoria normal es- 
tandar Z. En la tabla 9.5 se proporciona un resumen de los criterios de rechazo para 
la pueba de hipotesis con respecto a la media de una distribucion normal con varian- 
za conociaa. 

Antes de resolver un ejemplo, se desarrollara una expresidn general para la deter- 
minacion del error de tipo II para uno de los casos. Considerese la hipdtesis 
nula H 0 : p. = contra la alternativa H,: p. > Mo - Supongase que en realidad 
p. = pi > p 0 . De acuerdo con (9.9), no puede rechazarse H 0 si un valor de X es 
menor que (<r z, -J\/'n) + p 0 . Dado que la probabilidad del error de tipo II es igual 



FIGURA 9.8 Regiones criticas para hiootesis alternativas unilaterales 
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TABLA 9.5 Criterios de rechazo para la prueba de hipotesis con respecto a la media de una 
distribucion normal con varianza conocida 


Hipotesis nula 

Valor de la estadistica de prueba bajo H 0 

H 0 : M = Mo 

ft 

ik b 

II 

Hipdtesis alternativa 

Criterios de rechazo 

H m + Mo 

Rechazar H 0 cuando z =£ z„ /2 o cuandoz & z,-„ /2 

H\\ m > Mo 

Rechazar H 0 cuando z 3= z,- a 

H m < Mo 

Rechazar H 0 cuando z < z a 


a la probabilidad de no rechazar un H 0 falsa, es necesario determinar 


P = P\X<^^ + Mo 




M = Mi > Mo^, 


la que en terminos de la normal estandar es 


P = P 


o-z,_ a 

?=- + Mo - Mi 


Z< 


y/n 


cr / 



(9.11) 


A1 sustituir cualquier valor M| de la hipotesis alternativa en (9.11), se puede 
calcular el correspondiente valor de la probabilidad del error de tipo II y, de esta 
forma, la potencia. Notese que f3 (y la potencia) dependen del tamaflo de la muestra 
n, del tamaflo a, del error de tipo I, de la diferencia (mo — Mi) entre el valor pro- 
puesto Mo bajo H 0 y el verdadero valor Mi bajo H u y de la desviacion estandar cr 
de la poblacion. Para un valor fijo de a, (p 0 - Mi) y a < tamaflo del error de ti¬ 
po II disminuye conforme n aumenta. Para valores fijos de n, (mo — Mi) y cr, 
aumenta conforme a disminuye. Y para valores fijos de n, a, y a, /3 disminuye 
conforme la diferencia (mo ~ Mi) aumenta. 

Para otros casos, se pueden desarrollar expresiones similares a (9.11). El 
comportamiento general del tamaflo del error de tipo II como una funcion de n, a , 
(Mo ~ Mi)- y cr es igual al anterior. 


Ejemplo 9.6 Los siguientes datos representan los tiempos de armado para 20 unida- 
des seleccionadas aleatoriamente: 9.8, 10.4, 10.6,9.6,9.7,9.9, 10.9, 11.1,9.6, 10.2, 
10.3, 9.6, 9.9, 11.2, 10.6, 9.8, 10.5, 10.1, 10.5, 9.7. Supongase que el tiempo necesa¬ 
rio para armar una unidad es una variable aleatoria normal con media m y desvia¬ 
cion etandar cr = 0.6 minutos. Con base en esta muestra, ^existe alguna razon para 
creer, a un nivel de 0.05, que el tiempo de armado promedio es mayor de 10 minu¬ 
tos? 
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Considerese la hipdtesis nula 


H 0 : ix = 10 

contra la altemativa 

H,:/x> 10. 

Si puede rechazarse a H 0 con a = 0.05, entonces existe una razon para creer que el 
tiempo necesario para armar una unidad es mayor de 10 minutos. Dado que P(Z ? 

1.645) = 0.05, el valor critico en terminos de la variable aleatoria normal estandar 
es Z 0.95 = 1 -645. De los datos de la muestra, el valor x es igual a 10.2 minutos. En¬ 
tonces 


x — [Xq _ 10.2 - 10 
cr/yjn 0 . 6/\/20 


1.4907. 


Dado que z = 1.4907 < zo 95 = 1.645, no puede rechazarse la hipdiesis nula. El 
valor p en este caso es la probabilidad de que la variable aleatoria normal estandar 
sea mayor o igual al valor de 1.4907, dando como resultado que H 0 sea cierta. 
Puede verse, de la tabla D del apendice, que 

P(Z 3= 1.4907 | ix =' 10) = 0.0681. 

Puesto que p = 0.0681 > a = 0.05, se concluye que con base en la muestra no 
existe la suficiente evidencia para rechazar la hipotesis de que el tiempo promedio 
necesario para armar una unidad es de 10 minutos. 

En el contexto de este ejemplo, sup 6 ngase que se desea dar respuesta a la siguien- 
te pregunta. Si el verdadero tiempo promedio necesario para armar una unidad es de 
10.3 minutos, £cual es la probabilidad de rechazar la hipotesis nula? En este caso se 
desea obtener la potencia de la prueba para detectar la falta de veracidad de H 0 cuan- 
do el valor verdadero es de 10.3 minutos. Primero se obtendra el tamafio del error de 
tipo II. Mediante el uso de (9.11) se tiene 


(0.6)(1.645) 


P = P \Z < 


y/20 


==—~ + 10 - 10.3 


0.6/V20 



= P{Z< -0.59 | p. = 10.3) 


= 0.2776. 


De esta forma la probabilidad de equivocarse al rechazar H 0 cuando la media es 10.3 
minutos, es igual a 0.2776. Por lo tanto, potencia = 1 - /? = 0.7224. Si se sigue 
este procedimiento se obtienen /3 y las probabilidades de potencia para otros valores 
de p- bajo la hipotesis alternativa, tal y como se encuentran resumidos en la tabla 
9.6. Notese que conforme la diferencia entre el valor propuesto de la media bajo H 0 
y el valor verdadero bajo 7/, aumenta, la potencia de la prueba tambien aumenta. 

Supongase que se tiene la misma situacion pero con la excepcion de que no se co- 
noce el valor de la varianza poblacional a 2 .Con base en la seccion 8.4.2, la mejor es- 
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TABLA 9.6 Error de tipo II y probabilidades de potencia para el ejemplo 9.6 


p 

10.01 

10.1 

10.2 

10.3 

10.4 

10.5 

10.6 

10.7 

p 

Potencia 

0.9418 

0.0582 

0.8159 

0.1841 

0.5596 

0.4404 

0.2776 

0.7224 

0.0901 

0.9099 

m 

0.0024' 

0.9976 

0.0002 

0.9998 


tadistica de prueba a utilizar en este caso tiene una distribucion t de Student, Este es, 
bajo la hipotesis nula H 0 : p = p 0 la estadistica 

j _ X ~ Po 

s/y/n 

tiene una distribucion l de Student con n - 1 grados de libertad. El lector debe tcner 
muy poca dificultad al reconocer que mediante el empleo de la distribucibn t de Stu¬ 
dent, las regiones criticas para este caso son similares a las del caso anterior con res¬ 
pecto a las hipotesis alternativas uni o bilaterales. En la tabla 9.7 se proporciona un 
resumen. 

Ejemplo 9.7 Mediante el empleo de los datos del ejemplo 8.9, demostrar que para 
cualquier valor propuesto p 0 para p que se encuentre en el interior de un intervalo 
de confianza del 95%, una prueba de la hipdtesis 

H 0 : p = Po 

contra la alternativa 

H t : p =f po 


no lie vara al rechazo de H 0 para a = 0.05. 

Recuerdese la section 8.4.2 en la que un intervalo del 95% de confianza para p 
es 500.45-507.05. Es necesario demostrar que los llmites 500.45 y 507.05 coinciden 


TABLA 9.7 Criterios de rechazo para probar hipotesis con respecto a la media de una 
distribucion normal con varianza desconocida 


Hipotesis nula 

Valor de la estadistica de prueba bajo H a 

En'- p = Pn 

II 

Hipdtesis alternativa 

Criterios de rechazo 

H,: p j po 

Rechazar H„ cuando / s , o cuando / s* /i 1 

E\ - Pn 

Rechazar H„ cuando t 5* 

Hi- P < Pn 

Rechazar H u cuando t =£ t u „., 
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con los limites de los valores propuestos Mo bajo H 0 que llevan al rechazo de la hi¬ 
potesis nula. Dado que x = 503.75 y s = 6.2 para el llmite 500.45 se tiene 


503.75 - 500.45 

6.2/VI6 


2.131. 


y para el limite 507.05 


503.75 - 507.05 

6.2/VT6 


-2.131. 


Pero los valores ±2.131 son los limites de la region critica bilateral de tamafio a = 
0.05 y 15 grados de libertad. En otras palabras, si Mo « 500.45, entonces t s* 2.131, 
y si Mo 35 507.05,/ =£-2.131. De esta forma, cualquier valor propuesto Mo interior 
a 500.45 y 507.05 no llevar& al rechazo de H 0 con a = 0.05. 

Para ilustrar el calculo del valor p en el contexto de este ejemplo, considerese la 
siguiente hipotesis nula 

H q : m = 508 

contra la alternativa 


//,: m + 508. 

Dado que el valor propuesto de 508 se encuentra fuera del intervalo de confianza del 
95%, H 0 sera rechazada a un nivel a = 0.05. Para obtener el valor p se calcula el 
valor de la estadistica de prueba, el cual es 


503.75 - 508 
6.2/V76 


-2.742. 


Dado que la hipotesis alternativa es bilateral, el valor p esta dado por 

P{\T\ ^ 2.742) = P(T =£ -2.742) + P(T ^ 2.742), 

en donde T es una variable aleatoria t de Student con 15 grados de libertad. En la 
tabla F del apendice puede observarse que es necesario interpolar entre los valores 
cuantiles t a99 ,, = 2.602 y t UV9y ,, = 2.947. Entonces t u992 . u = 2.742, y el valor/? 
es, en forma aproximada, 0.016. Por lo tanto, si la hipotesis nula es cierta, existe 
una oportunidad menor del 2% para observar un valor de la distribucion / de Stu¬ 
dent con 15 grados de libertad cuya magnitud sea igual o mayor al valor observado 
de 2.742. 

La determinacion de la potencia y de las probabilidades de los errores de tipo II 
para la estadistica T es algo mas dificil que en el caso previo, el cual involucraba una 
distribucion normal. La dificultad surge debido a que la distribucibn de la 
estadistica de prueba, si //„ es falsa, no es exactamente igual a la distribucion t de 
Student. De hecho, bajo la hipotesis alternativa la estadistica tiene lo que se conoce 
como una distribucion t no central, la cual difiere de la ordinaria t de Student por la 
introduccion de un parametro adicional. El parametro, denotado por 8, se define 
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por 

5 = ^-^ 

cr 

y expresa la diferencia entre el verdadero valor de p bajo //, y el valor propuesto po 
bajo H 0 en terminos de cr. Como resultado se tiene que la funcion de potencia de la 
estadistica T depende tanto de los grados delibertad v y de5. En este casoexisten las 
curvas CO como funciones de 5 y del tamaflo de la muestra n tanto para las hipote- 
sis altemativas unilaterales como para las bilaterales (vease [ 1 ]). Estas revelan el mis- 
mo comportamiento para el tamaflo del error de tipo II con respecto a n, a, y la 
diferencia entre los valores bajo H, y H 0 al igual que en el caso previo. Debe notarse 
que para muestras de tamaflo relativamente grande, por ejemplo mayor que 30, el 
calculo de la potencia para la estadistica T se puede manejar en forma adecuada me- 
diante el empleo de la aproximacion normal. 


9.6.2 Pruebas para dos muestras 

Sean X\,X 2 , .... X„ y y Y t , Y 2 . Y, h muestras aleatorias provenientes de dos dis- 

tribuciones normales independientes con medias p x y p> y varianzas crl y a Y . res- 
pectivamente. Supongase que se desea probar la hipotesis nula 

Ho - Px - pY = So 

contra una de las siguientes altemativas: 

H i • Px ~ Pr f So Hi '■ Px ~ P-y - > H |: p x — p Y < 8 U , 

en donde 8 0 es una cantidad que toma valores positivos o cero y la cual representa la 
diferencia propuesta entre los valores desconocidos de las medias. Supongase que las 
varianzas de la poblacion se conocen. De las discusiones en las secciones 7.7, 8.4.3 y 
el material precedente de este capitulo, es razonable concluir que la estadistica de 
prueba apmpiada es la diferencia muestral media X - Y. En particular, si un valor 
de X - Y con base en la muestra aleatoria es lo suficientemente diferente, mayor o 
menor que 8 0 , se rechazara la hipotesis nula dependiendo de la hipotesis alternativa 
en cuestion. Una transformacion a la distribucion normal estandar da origen a una 
forma equivalente de la prueba estadistica dada por (8.41). En la tabla 9.8 se propor- 
ciona un resumen de la informacion pertinente para este caso. 

Ejemplo 9.8 Supongase que se tienen muestras aleatorias de igual tamaflo n de dos 
distribuciones normales independientes con varianzas conocidas cr x y <U, las cuales 
se emplean para probar la hipdtesis nula 

H{)'- P\ — py = 8 0 


contra la alternativa 


H\: px - Py = 8 , > 8 U . 
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TABLA 9.8 Criterios de rechazo para la prueba de hip6tesis con respecto a las medias de dos 
distribuciones normales e independientes con varianzas conocidas 


Hipdtesis nula 

Valor de la estadistica de prueba bajo H a 


x -y - So 

Ho: p x ~ Py = So 

<Xx rr'r 


\n x n y 

Hipdtesis alternative! 

/ 

Criterios de rechazo 

H d Px ~ Pr / So 

Rechazar H 0 cuando z « z„ n o cuando z 3= z, 

H,: fi x ~ Pr > S ( , 

Rechazar H„ cuando z » z t a 

H Px ~ Pr < S„ 

Rechazar H 0 cuando z z^ 


Si se especifican los tamanos particulares a y 0 de los errores de tipo 1 y de tipo 11, 
respectivamente, obtener una expresion para n. 

Si H 0 es realmente cierta, la probabilidad de rechazarla es a; y si H 0 es falsa 
(p x - p Y = 8, > 8 0 ), la probabilidad de no rechazar // 0 es fi. Sea c 0 el valor critico 
/con respecto a la distribution de muestreo de X — Y. Entonces H 0 sera rechazada 
cuando x - y > c 0 , tal que 

P(X — Y 5* c 0 | p x — Py — 8 0 ) = a. 

En terminos de la variable aleatoria normal estandar, lo anterior es equivalente a 


P\Z 


Cp 8q 

J vx + o- y 


Px Py — 8 0 — a. 


Dado que pueden determinarse valores cuantiles z, - n de la normal entandar tales 
que 


se tiene 


P(Z 5= z,_„) = a, 

c o - 8 0 


<rx + o"y 


Z \ - a ' 


(9.12) 


Si Px ~ Pr = 8, > 8 0 , entonces la probabilidad de no rechazar a H 0 es /3. Por 
lo tanto 

P(X — Y < c 0 | p x ~ Py = 8,) = f3 , 
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que en terminos de la variable normal estandar es 


P Z< 


c 0 




(Ty 


8 . = 0 - 


Pero el valor cuantil Zp debe ser un punto de la normal estandar tal que 

P(Z<ip) = 0. 

Entonces se sigue que 

Co — 8| 


o* + a l 


= tp- 


(9.13) 


Debe notarse que puesto que es poco probable que j 3 sea menor que 0 05, el valor 
cuantil z 0 es negativo. 

Notese que las ecuaciones (9.12) y (9.13) contienen dos incognitas: c 0 y n. Para 
resolver para n, primero se resolveran ambas ecuaciones para c 0 . 


Co — Z\ -a, 




Co - Zp 


l<Tx + <r~y 


+ 8 ,. 


A1 igualar ambos miembros derechos, se tiene 

M -or 


± Is + 8 0 = Zp r- x - - - K + 8, 


(z,-u - Zp) = 8 , - 8 „. 


Dado que para la normal estandar 


— <• I - $ » 


/(Tv + CTv 


(m _ u + c.i ~p) — 8| 8». 

» n 

la cual, despues de resolver para n, se reduce a 

_ ((Ty + C Ty) (Z,_ a + Z,-pf 


(8, - S 0 ) 2 


(9.14) 


La expresion (9.14) deter mi 


a unade las dos muestras aleato- 
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rias en las dos distribuciones normales independientes, asegurando probabilidades a 
y (3 para los errores de tipo I y tipo II, respectivamente, cuando se prueba 

H 0 : V-x ~ Py — 8q i 


contra 

H\ : Px ~ 1 *-y = > &o- 

Para un ejemplo especifico, sean u 2 x - 25, cry - 20, S 0 = 5, 8, = 8, a = 0.05, 
y (3 = 0.10. Entonces z„ 95 = 1.645, z„„, = 1.28, y 

(25 + 20)( 1.645 + I.28) 2 
" *--' 43 ' 

Se invita al lector a que obtenga una expresion similar para la hipbtesis alternati- 
va del lado izquierdo. Para una hipbtesis alternativa bilateral, es posible obtener una 
aproximacibn del tamaflo de n mediante el empleo de la expresibn (9.14) y reempla- 
zando a con a/2. A pesar de que este enfoque no es exacto, para muchas situaciones 
practicas es suficiente. 

A continuacion se examinara el caso en el que el valor de la varianza no se cono- 
ce; si las varianzas o> y o> no se conocen pero se supone que son iguales, entonces 
para la hipbtesis nula 

tfo P-.V — py ~ b() 

la estadistica de prueba es 


T = 



(9.15) 


la cual tiene una distribucion t de Student con n x + n r — 2 grados de libertad. El 
estimador combinado S 2 P de la varianza comun cr 2 esta dado por la expresion (7.28). 
De las discusiones anteriores, las regiones criticas de tamaflo a para las hipbtesis al- 
ternativas uni y bilateral, deben ser evidentes. Estas se encuentran resumidas en la 
tabla 9.9. 


Ejemplo 9.9 En forma reciente se ha incrementado el interes de evaluar el efecto 
del ruido sobre la habilidad de las personas para llevar a cato una determinada tarea. 
Un investigador disena un experimento en el que se pedira a un determinado numero 
de sujetos que lleven a cabo una tarea especifica en un medio controlado y bajo dos 
niveles diferentes de ruido de fondo. El investigador selecciona 32 personas que son 
capaces de realizar la misma tarea y de manera practica en el mismo tiempo. Del 
total de personas, 16 seleccionadas al azar realizaran esta tarea bajo un nivel modes- 
to de ruido de fondo. Las restantes 16 llevaran a cabo la misma tarea bajo un ruido 
de nivel 2, el cual es mas severo que el ruido de nivel 1. Los siguientes datos represen- 
tan los tiempos observados (en minutos) que fueron necesarios para completar la ta¬ 
rea para cada una de las 16 personas de cada nivel. 

www. FreeLibros. com 



9.7 Prueba de hipdtesis con respecto a las medias 337 


TABLA 9.9 Criterios de rechazo para la prueba de hipdtesis con respecto a las medias de dos 
distribuciones normales e independientes con varianzas iguales pero desconocidas 

Hipdtesis nula 

Valor de la estadlstica de prueba bajo H„ 

\ 

x - y - 8« 

Hn '■ Px ~r Py = 8j 

X ■*, /I + 1 


v n x n y 

Hipdtesis alternativa 

Criterios de rechazo 

Hi - Px ~ Py i 1 8,i 

Rechazar H„ cuando t s t„ r o cuando t + 


en donde m = nx + n Y — 2 

H i • F-x ~~ F-y ^ 

Rechazar //„ cuando / 3= ti- a .,„ 

H 11 ~ M y < So 

Rechazar H„ cuando t + t a l „ 


Nivel 1 

14 12 

15 

15 11 

16 

17 

12 14 

13 

18 

13 18 15 

16 11 

Nivel 2 

20 22 

18 

18 19 

15 

18 

15 22 

18 

19 

15 21 22 

18 16 


Asumiendo que estos datos constituyen muestras aleatorias de dos distribuciones 
normales e independientes con varianzas iguales pero no conocidas, ^existe alguna 
razon para creer que el tiempo promedio para el nivel 2 es mayor por mas de dos mi- 
nutos que para el nivel 1 con a = 0.01? 

Sean pi y p 2 las medias desconocidas para los niveles 1 y 2 respectivamente. El 
valor propuesto para la diferencia entre p 2 y p t es 8 0 = 2. En otras palabras, se 
afirma que el valor de p 2 es mayor que p., por una cantidad igual a dos minutos; 
pero en realidad lo que se desea demostrar es que p 2 es mas grande que p, por mas 
de dos minutos. De acuerdo con lo anterior, considerese la hipotesis nula 

H 0 : p 2 ~~ Mi = 2 


contra la alternativa 

Hi'- pi — P\ > 2. 

Dado que a = 0.01 y n, = n 2 = 16, el valor critico es r 099 30 = 2.457. Delos 
datos se tiene que .T) = 14.375, x 2 = 18.5, s, = 2.2767, y s 2 = 2.4495; por lo que el 
estimado combinado de la varianza comun es 


.v 


2 

P 


(15X2.2767) 2 + 15(2.4495) 2 
16+16-2 


5.5917, 


o 

s p = 2.3641. 
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Entonces el valor de la estadistica de prueba es 

, - " 8 5 - 2.5417. 

2.3647 — + — 

V 16 16 

Dado que el valor de 2.5417 se encuentra dentro de la regi6n critica de tamaflo 0.01, 
se rechaza la hipotesis nula. Bajo H 0 , el valor p es la probabilidad de que Ts* 2.5417, en 
donde T~ t de Student con 30 grados de libertad. Mediante el empleo de la tabla F del 
apendice y despues de interpolar, se obtiene que 

P(Tsz 2.5417) = 0.0085. 

Por lo tanto, con base en este experimento, puede concluirse que la diferencia entre 
las medias de los niveles 1 y 2 es mayor de dos minutos estadisticamente discernible 
con valor p de 0.0085 

9.6.3 Reflexion sobre las suposiciones y sensitividad 

Antes de pasar a la siguiente section, puede ser benefico el detenerse un momento y 
reflexionar sobre las suposiciones que se han formulado con respecto a las pruebas 
de hipotesis estadisticas sobre las medias. Se ha hecho enfasis con anterioridad, en 
que los procedimientos inferenciales estadisticos proporcionan un camino objetivo y 
veraz para formular inferencias con respecto a las caracteristicas de la poblacion con 
base en muestras aleatorias. Estos procesos por lo general tienen exito solo cuando 
las suposiciones que se han formulado para el desarrollo de las distribuciones de 
muestreo apropiadas se adhieren en forma razonable a la poblacion. Los enfoques 
fortuitos y casuales para la aplicacion de los metodos estadisticos, sin una compren- 
sion de sus suposiciones y de las posibles consecuencias si estas no se satisfacen, 
muchas veces lleva a una mala interpretation y a conclusiones erroneas. 

Como ya se ha visto, la distribucion t de Student juega un papel muy importante 
para formular inferencias con respecto a las medias, en forma especial en muestras 
de tamaflo modesto. Pero la distribucion t se basa en la suposicion de que el 
muestreo se lleva a cabo sobre una distribucion normal. Si el muestreo no se lleva a 
efecto sobre una distribucion normal, el uso de la distribucion t de Student es inco- 
rrecto debido a que, por ejemplo, las regiones criticas de tamaflo a son probable- 
mente mas grandes que el valor que se especifica para a. Sin embargo, en forma 
afortunada, la distribucion t es muy robusta, o insensible a la suposicion de normali- 
dad, y en forma especial cuando el tamaflo de la muestra es mayor o igual a 15. 

Cuando se emplea la distribucion t de Student para comparar dos medias, es 
mucho mas severo violar la suposicion de varianzas iguales que la suposicion de nor- 
malidad. Por una razon intuitiva del efecto aparente, supongase que en realidad se 
estan muestreando dos distribuciones normales, una con media p = 100 y desvia- 
cion estandar <r = 20, y la otra con p = 120 y a = 30. El intervalo cuatro sigma 
de la primera es de 60 a 140 mientras que para la segunda es de 60 a 180. Por lo tan¬ 
to, puede observarse un valor menor o igual a 140 en cualquiera de las dos pobla- 
ciones. Sin embargo, estos valores. no implicaran que exista una diferencia entre 
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las dos medias. Unicamente las observations de una segunda muestra que 
sean mayores de 140 empezarian a sugerir una diferencia media aparente, pero su 
numero es probablemente demasiado pequeflo para hacer la diferencia entre las me¬ 
dias discernibles. De esta forma, con base en la estadistica T es probable que se lle- 
gue a la conclusibn equivocada de que no existe diferencia entre las medias con una 
frecuencia inaceptable debida al desbalance en la variacibn inherente de las dos dis- 
tribuciones. 

Para cuantificar el efecto de varianzas desiguales se simularon 1 000 muestras 
aleatorias, cada una de tamaflo 20 a partir de dos distribuciones normales mediante 
el empleo de paquete IMSL. Para la primera distribucibn se escogieron los valores 
de la media y de la desviacion estandar iguales a 100 y 20, respectivamente. Para la 
segunda se emplearon los valores de 110, 120 y 130 para la media, y los valores de 
25, 30 y 40 para la desviacibn estbndar. De acuerdo con lo anterior se simularon 12 
casos donde para cada par de muestras aleatorias se probo la hipotesis 

H 0 : p t - p 2 = 0 


contra la alternativa 


//,: p, - p 2 < 0 

mediante el uso de la estadistica T de Student dada por (9.15). Para cada caso se 
determino el numero, de entre 1 000 ensayos, para el que la hipbtesis nula no podia 
rechazarse con a = 0.05. De esta forma es posible comparar el tamaflo del error 
de tipo II para cada caso contra el valor correspondiente que puede obtenerse de las 
cufvas CO en [1], cuando ambas desviaciones estbndar tienen un valor igual a 20. Las 
probabilidades para el error de tipo II se dan en la tabla 9.10. Cuando se comparan los 
valores 0 para varianzas iguales, existe un incremento apreciable en el tamaflo del 
error de tipo II conforme la diferencia entre las varianzas es mbs pronunciada. Por lo 
tanto, el efecto de violar la suposicion de varianzas iguales cuando se comparan las 
medias puede ser sustancial. 

Ahora se examinara el efecto en el tamaflo del error de tipo I si se viola la suposi- 
cibn de varianzas iguales. Esto es, si se supone que H 0 es cierta, £que efecto pueden 
tener las varianzas desiguales sobre a? Scheffe [4] determino que si los tamaflos de 
las muestras n,y n 2 son grandes pero iguales, la estadistica T es considerablemente 
mas robusta a la suposicion de varianzas iguales cuando se comparan dos medias. 
La tabla 9.11 (vease [4] para los detalles) contiene el tamaflo del error de tipo I con 


TABLA 9.10 Probabilidades (3 simuladas para el efecto de varianzas desiguales cuando se 
comparan dos medias (p, = 100, a, = 20) 



cr, = 20 

cr, = 25 

cr, = 30 

cr, = 40 

Pi = 110 

0.550 

0.626 

0.687 

0.758 

/u, = 120' 

0.065 

0.139 

0.209 

0.389 

Pi = 130 

0.002 

0.008 

0.021 

0.093 
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TABLA 9.11 Probabilidades a para el efecto de varianzas desiguales cuando se comparan 
dos medias 


<ri /cr\ 



1/5 

1/2 

1 

2 

5 


1 




0.050 



2 

0.120 



0.029 



5 

0.220 


0.050 

0.014 



base en un intervalo de confianza del 95% para /x, - /x 2 como una funcion del co- 
ciente de los dos tamaflos muestrales y el cociente de las dos varianzas. Notese que el 
tamaflo del error de tipo I no cambia en el primer renglbn con respecto a su valor 
preestablecido de 0.05, aun a pesar de que el cociente de las varianzas cainbie. 

A traves de toda la discusion de la inferencia estadistica se ha supuesto que se ob- 
tiene una muestra aleatoria y que por lo tanto las observaciones se encuentran inde- 
pendientemente distribuidas. Si estas suposiciones no se cumplen, es probable que 
cualquier inferencia estadistica que se formule sea erronea sin importar el tamaflo de 
la muestra. Aun asi, la suposicion que, en forma probable, es la que se viola, la ma- 
yoria de ; las veces es la de una muestra aleatoria. 

Relacionado en forma cercana al concepto de aleatoriedad, es la seleccion de la 
muestra cuando las medias de los dos niveles (o mas, como se estudiara mas adelan- 
te) se comparan entre si. Con propbsitos de ilustracion, recuerdese el ejemplo 9.9. 
Dado que se seleccionaron 16 personas aleatoriamente para desempeflar la tarea 
dada bajo el nivel 1, se deduce que las personas que realizaron la tarea en el nivel 2 
tambien fueron seleccionadas de manera aleatoria. Este procedimiento asegura una 
asignacion imparcial de cuales de las 32 personas se encontraran sujetas a un deter- 
minado nivel de ruido. En inferencia estadistica este proceso de seleccion imparcial 
recibe el nombre de aleatorizacion. El principio de aleatorizacion protege contra la 
introduccion de sesgo sistematico en la asignacion de personas u objetos a diferentes 
niveles y por ello consolida la credibilidad de la inminente comparacion. 

Se ha visto como las diferencias inherentes en la variabilidad pueden oscurecer la 
comparacion entre dos medias. Muchas veces, durante el proceso de observar datos 
muestrales, factores externos no controlados pueden causar diferencias en la varia¬ 
bilidad. Sin embargo, mediante la adhesion al principio de aleatorizacion, estos fac¬ 
tores externos probablemente tengan un efecto balanceado sobre las mediciones 
bajo los dos niveles de interes. Por ejemplo, en el problema del ruido, factores tales 
como el estado de animo del individuo en el momento de realizar la tarea no pueden 
ser controlados. El principio de aleatorizacion tiende a neutralizar tales efectos. 

9.6.4 Prueba sobre las medias cuando las observaciones estan pareadas 

De la ultima section recuerdese que cuando se comparan las medias de dos niveles, 
es deseable tener a las personas u objetos que produciran las observaciones dentro de 
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cada nivel, tan homogeneas como sea posible. Si existe un efecto debido a factores 
externos, estos pueden neutralizarse mediante la aplicacion del principio de aleatoric 
zacidn. Tambien es posible controlar la variacibn no deseada controlando los facto¬ 
res extraflos. Esto se logra tomando las observaciones en pares, donde se supone que 
las condiciones externas son las mismas para cada par pero pueden variar de par 
en par. En forma general, existe una relacibn natural entre las observaciones de un 
par. Esto es, para cada par se selecciona una persona u objeto al azar y se somete a 
ambos niveles de interes. A pesar de que se desea determinar si existe alguna diferen- 
cia entre las medias, no puede considerarse a los pares como dos muestras aleatorias 
independientes. 

Como ilust ration, se examinara el siguiente problema: un investigador medico se 
interesa en determinar si un f&rmaco experimental tiene el efecto colateral no desea- 
ble de elevar la presibn sistolica sanguinea. Para conducir un estudio de amplia co- 
bertura se seleccionan en forma aleatoria n personas de diferentes edades y condicio¬ 
nes de salud. En un ambiente controlado de laborutorlo se toma la presibn sangui¬ 
nea de los n sujetos y se les '•dministra el farmaco durante un lapso adecuado de 
tiempo despues del cual se les vuelve a tomar la presibn sanguinea. 

Sean (X, , K,), (X 2 , Y 2 ) . (X„ , Y„) los n pares, donde ( X, , V') denota la pre- 

sion sistolica sanguinea del /-esimo sujeto antes y despues de adiministrar el medica- 
mento. Notese que en este caso los factores externos son la condicion del individuo 
en relacion con su edad, su salud y otras pecualiaridades que pueden tener un efecto 
unico sobre la presion sanguinea. Puesto que cada sujeto forma un par, el efecto de 
los factores externos sobre la presion sanguinea se encuentra entre los pares y cual- 
quier diferencia sustancial de la presion dentro de cada par puede atribuirse al efec¬ 
to de la droga. Asi, al tomar la diferencia entre las dos observaciones de cada par es 
posible remover (bloquear) la variabilidad en la presibn sanguinea a consecuencia de 
los factores externos. Esto hace posible una comparacibn valida de la presibn sangui¬ 
nea antes y despues de administrar el medicametno. Por lo tanto, el interes se centra 
en la columna de diferencias de la tabla 9.12 generada al restar una observacibn de la 
otra para cada par. 

Se supone que las diferencias £>,, D 2 . D„ constituyen variables aleatorias in¬ 

dependientes distribuidas normales tales que E(D,) = p.,, y Var(D,) = erf, para 
toda / = 1.2 . n. Lo anterior es posible si se supone independence entre los pa- 


TABLA 9.12 Diferencias entre las observaciones en un experimento 


Niimero de par 
( persona) 

Nivel 1 
(PS antes) 

Nivel 2 
(PS despues) 

Diferencia 

Y - X* 

1 

X , 

Y\ 

D, = Y, - X, 

2 

X 2 

Y-, 

d 2 = v 2 - x 2 

n i 

x„ 

Y n 

p 

II 

^ • 

l 


* Puede tomarse facilmente la diferencia X — Y. 
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res (pero no necesariamente entre los valores de estos) de manera tal que E[X,) - /x, 
y E( Y,) = Hi + /j. n para / = 1,2 ... rt. De esta forma para el /'-esimo par, los valo¬ 
res esperados difieren por una constante, la cual es el valor esperado de A para i = 
1, 2 ... n. Adem&s, Var(Xj ) = <x* y Var(Y,) = cry son desconocidas y no necesa¬ 
riamente iguales, pero se supone que son constantes para toda / = 1,2 

En el contexto del problema de la presidn sanguinea, lo que se esta diciendo es lo 
siguiente: la constante p-p es la diferencia media en la presion sanguinea como con- 
secuencia del medicamento. Aun a pesar de que las presiones sanguineas promedio 
varian de persona a persona por las diferencias en las condiciones de salud, se piensa 
que Md es probablemente igual para todas las personas. Notese que si /x D fuese 
cero, esto podria sugerir que el medicamento no tiene ningun efecto sobre la presion 
sanguinea. Por otro lado, si Md es mayor que cero, esto podria indicar un incremen- 
to de la presion sanguinea promedio a consecuencia del medicamento. La varianza 
o~p de las diferencias en la presidn sanguinea no es conocida y depende de las varian- 
zas antes y despues de administrarse el medicamento. A pesar de que las varianzas 
cr\ y (t\ pueden ser dife r entes, se supone que son constantes de persona a persona. 

La discusion anterior demuestra que se pueden formular inferencias sobre las 
medias de dos niveles cuando las observaciones estan pareadas al considerar la co- 
lumna de diferencias como una sola variable aleatoria y al aplicar los metodos de la 
seccion 9.6.1. Bajo la hipotesis nula 

H 0 : iip = 8 0 » 

la estadistica 


T = -—^ (9.16) 

Sp/Vn 

tiene una distribucion t de Student con n - 1 grados de libertad, en donde 

n 

5=2 A In 

/-I 

y 

n 

S 2 p = 2 (A - Df/(n - 1). 

/= i 

Las regiones criticas de tamafio a para las hipotesis alternativas uni y bilaterales se 
encuentran resumidas en la tabla 9.13. 

Ejemplo 9.10 En el problema anterior de la presion sanguinea, sea a = 0.01 y 
pruebese la hipotesis nula 

// 0 • Mo = 0 

contra la alternativa 


El i: /Xp > 0, 
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TABLA9.13 Criterios de rechazo para la prueba de hip6tesis con respecto a las medias 
cuando las observaciones estan pareadas 


Hipdtesis nula 

Valor de la estadistica de prueba bajo H v 

Ho- P-d = 8o 

t ~ d ~ So 

sj\/n 

Hipdtesis altemativa 

Criterios de rechazo 

H i ■ p-d 7^ 8o 

Rechazar H 0 cuando / -s t a/2 

H\ : p. d > So 

o cuando / ^ /,-„/ 2 .„-i 

Rechazar H a cuando / s- r, , 

Hi', po < 5o 

Rechazar H 0 cuando / « t a 


con base en los datos muestrales de la tabla 9.14. 

En la columna de diferencias se tiene que d = 3.75 y s D = 3.7929. De esta 
forma el valor de la estadistica de prueba es 


3.7929/\/l2 

Dado que el valor critico es t 0 99j ,, = 2.718, se rechaza la hipotesis nula de no efecto 
del medicamento. Por lo tanto, con base en los resultados de este estudio, un incre- 
mento en el valor promedio de la presion sanguinea es estadisticamente discernible 
con un valor p de 0.0036. 

Es importante notar que en el ejemplo anterior no existe ninguna oportunidad de 
aplicar el principio de aleatorizacion para remover los posibles sesgos sistematicos. 


TABLA 9.14 Datos muestrales para el ejemplo 9.10 


Sujeto 

PS 

antes 

PS 

despues 

Diferencias 
(despues - antes) 

1 

128 

134 

6 

2 

176 

174 

-2 

3 

110 

118 

8 

4 

149 

152 

3 

5 

183 

187 

4 

6 

136 

136 

0 

7 

118 

125 

7 

8 

158 

168 

10 

9 

150 

152 

2 

10 

130 

128 

-2 

11 ' 

126 

130 

4 

12 

162 

167 

5 
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Lo anterior es tipico de las situaciones antes-despues en las que las observaciones se 
aparean con el proposito de remover efectos externos. Sin embargo, es posible que 
intervengan otros factores externos entre las mediciones y que estos causen diferen- 
cias sustanciales en las observaciones de algunos pares; esta influencia sera acredita- 
da de manera equivocada a los efectos que se estan verificando. En el problema de la 
presion sanguinea algunos de los sujetos pueden sufrir cambios en su salud que sean 
independientes del medicamento que se les administra, y estos cambios pueden a su 
vez causar un aumento (o diminution) de la presion sanguinea. El siguiente ejemplo 
proporciona un experimento mejor para comparar dos medias para observaciones 
pareadas. 

Ejemplo 9.11 La investigation ha desarrollado variedades superiores de maiz que 
proporcionaran cantidades mas grandes de este por unidad de tierra. Un investiga- 
dor ha desarrollado una nueva variedad hibrida de este grano y piensa que es supe¬ 
rior a la mejor variedad disponible. Tambien cree que esta nueva variedad rebasara 
con mucho la produccion estandar en varias localidades geograficas. Para verificar 
lo anterior, el investigador disefta el siguiente experimento: se seleccionan 10 parce- 
las de igual tamafto cada una en distinta localidad geografica. Cada parcela se divide 
en dos secciones iguales, de manera tal que puedan cultivarse las dos variedades en 
cada localidad. Para remover los posibles sesgos sistematicos, se aplica el principio 
de aleatorizacion a todas las parcelas para decidir que section es la que se cultiva y 
con que tipo de variedad. Lo anterior se logra lanzando una moneda para decidir la 
variedad. Se controlan tantos factores como es posible; por ejemplo, la temporada 
de siembra, el tipo de fertilizante y el intervalo de aplicacion. En el momento de re- 
coger la cosecha, se anotan las toneladas por unidad de area. Supongase que los da- 
tos que se muestran en la tabla 9.15 son los que se observaron. Con base en estos 
datos, obtengase un intervalo de confianza del 95% para la diferencia media en la 
produccion entre las variedades X y Y. 

Antes de proceder con el analisis, debe notarse que se estan bloqueando los fac¬ 
tores externos como resultado del apareamiento en la localidad geografica. En situa¬ 
ciones de este tipo, existe muy poca duda con respecto a que las condiciones de la 
tierra y otros efectos probablemente no sean los mismos en las diferentes localida¬ 
des. De esta forma existe una gran oportunidad para observar un efecto sustancial 
sobre la produccion a consecuencia de la localidad. Tambien, notese que esta oportu¬ 
nidad se presenta al aleatorizar la asignacibn de variedades a las parcelas para remo¬ 
ver cualquier sesgo sistematico. 


TABLA 9.15 Datos muestrales para el ejemplo 9.11 


Tipo 


L: 

Ly 

Li 

/.s 

U 

L- 


L, 

Lm 

Variedad A' 

(estandar) 

23 

35 

29 

42 

33 

19 

37 

24 

35 

26 

Variedad Y 
(nueva) 

26 

39 

35 

40 

38 

24 

36 

27 

41 

27 
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Para obtener el intervalo de confianza deseado, las diferencias entre las produc- 
ciones de X y Fen las 10 localidades son -3, -4, -6, 2, -5, -5, 1, -3, -6, y 
-1. Con base en 6stas, d = -3 y s D = 2.8284. Asumiendo que estas diferencias 
son los valores de dos variables aleatorias independientes y normalmente distribui- 
das, un intervalo de confianza del 95% para Md es 

o 

-3 ± (2.262)(2.8284/VT5). 


el que se reduce al intervalo (- 5.0232, -0.9768). Dado que el valor cero no se in- 
cluye en este intervalo, se rechaza la correspondiente hipotesis nula de que la dife- 
rencia es cero a un nivel de a = 0.05 

Result- apropiado colocar el problema de comparar las medias de dos niveles 
en una mejor perspectiva para justificar la planeacion de un experimento con base en 
muestras independientes o con base en muestras pareadas. Sean X y Y los dos nive¬ 
les de interes, asumiendo un tamafio n igual para las dos muestras independientes y n 
pares de observaciones. Dado que lo que se desea en cualquiera de los casos es una 
inferencia^ con_respecto a la diferencia entre las medias, la estadistica para ambos 
casos es X - Y. De esta manera, bajo la suposicion de que se muestrean distribucio- 
nes normales un intervalo de confianza del 100(1 - a)% para la diferencia 
media en cualquiera de los casos es de la forma general 


VC- Y)± t^ al2 _,„d.e.(X - Y), (9.17) 

donde m es el numero de grados de libertad. En la expresion (9.17) existen dos termi- 
nos que difieren en ambos casos. Uno es el valor cuantil /, u/2 ,„,; y el otro es la des- 
viacion estandar de la estadistica X - Y. Cuando las observaciones son pareadas, el 
valor cuantil es una funcion de m = n - I grados de libertad, mientras que para 
muestras independientes se basa en m = 2 (n - 1) grados de libertad. Para un a 
dado, el valor cuantil aumenta conforme el numero de grados de libertad disminuye. 
Entonces, un intervalo de confianza para muestras pareadas es mas amplio debido a 
la perdida de grados de libertad. 

A la luz de la information anterior, la desviacion estandar de X — Y secon- 
vierte en un cambio a mantener en mente cuando se escoge entre muestras indepen¬ 
dientes o muestras pareadas. Si se permite a un factor extrano, el cual inlluye en forma 
potencial que vane, cuando se toman las muestras independientes, la eonseeuen- 
cia probable es una variabilidad importante entre las observaciones, dando como 
consecuencia un valor grande d.e. ( X — Y). Al parear las observaciones, es posible 
neutralizar la influencia del factor extrano y mantener su efecto igual dentro de 
cada par. Entonces, las observaciones dentro de cada par estaran probablemente co- 
rrelacionadas. Esto es, para un par dado, es probable que un valor grande de X de 
como resultado un valor grande de Y o viceversa, lo cual da como resultado unaco- 
varianza positiva entre X y Y. Se sigue entonces que, dado VuriX y )=Jur(A ) 
+ Vnr{ Y) - 2 Coi (X. Y). la varianza de X - Y (asi como tambien la de X - Y) 
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sera mas pequefla para muestras pareadas que para muestras independientes. Por lo 
tanto, en un experimento bien planeado para observaciones pareadas, la reduccibn 
en el valor de la desviacion estandar de X — Y, por lp general compensarb el 
aumento en el valor critico debido a la reduccibn en el numero de grados de libertad. 

Como ilustracibn, en el ejemplo 9.11 se calculb el estimador s D = 2.8284. Si los 
datos se consideran como muestras independientes de dos distribuciones normales 
con varianzas iguales, un estimado de la varianza comun es 

, 9(52.6778) + 9(43.1222) 

s p = -jj- - «.», 

o s p = 6.921 el valor s p = 6.921 es mas del doble del valor s D = 2.8284. Alcons- 
truir un intervalo de confianza del 95% para muestras independientes, se obtiene 

-3 * (2.101X6.921) + ± 

o 

(-9.5029, 3.5029). 

El obvio que no puede rechazarse la hipotesis nula de no diferencia entre las medias, 
si los datos fuesen considerados como muestras independientes. 


9.7 Pruebas de hipotesis con respecto a las varianzas cuando se 
muestrean distribuciones normales 

Se argumento con anterioridad, que una inferencia con respecto a una varianza es tan 
importante como una con respecto a la media. En medios industriales, por ejemplo, 
la variabilidad de un producto puede ser una medida mas importante que el prome- 
dio del producto. Por esta razbn, asi como tambien por la necesidad de comprobar 
la hipotesis de varianzas iguales, se presentaran criterios para probar hipdtesis con 
respecto a las varianzas con base en una sola muestra aleatoria o con base en dos 
muestras aleatorias independientes provenientes de distribuciones normales. Como 
era de esperarse, los criterios para probar hipotesis con respecto a las varianzas se 
basan en los correspondientes metodos para construir intervalos de confianza, tal 
como se descutio en las secciones 8.4.4. y 8.4.5. Nuevamente es imperativo hacer en- 
fasis en que estos procedimientos son, en forma especial, sensibles a la suposicion de 
normalidad. 

9.7.1 Puebas para una muestra 

Sea X t , X 2 , ..., X n una muestra aleatoria de una distribucion normal con media p- 
desconocida y varianza cr 2 desconocida. Considerese nula la prueba de la siguiente 
hipotesis 


H 0 : cr 2 = ai 
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contra una de las siguientes alternativas ? 1 

H,:a 2 ^=al, H t :a 2 >al, H l :a 2 <al, 

donde trl es el valor propuesto para a 2 . La estadistica de interns es.la varianza 
muestralS 2 . La hipdtesis nula sera rechazada si la realizacidn de S 2 calculada a par- 
tir de la muestra, es, en forma suficiente, diferente, mayor que o menor que , de- 
pendiendo de la hipdtesis alternativa. Perobajo//„, la cantidad (n - 1)s 2 /o-q es un 
valor de una variable aleatoria chi-cuadrada con n -1 grados de libertad. Entonces, 
por ejemplo, si la hipdtesis alternativa es H t : a 2 > al, se rechazara a H 0 si el 
valor de (n - l)s 2 /al se encuentra dentro de la region critica de tamaflo a en el la- 
do derecho de la distribucidn chi-cuadrada con n - 1 grados de libertad. En la tabla 
9.16 se proporciona la informacion mas relevante al respecto. 

Como se notd con anterioridad, la violacidn de la suposicidn de que el muestreo 
se lleva a cabo sobre una distribucidn normal tiene un efecto sustancial cuando se 
emplea la estadistica chi-cuadrada para inferencias con respecto a las varianzas. 
Para ilustrar este efecto, se simulo un experimento similar al descrito en la seccion 
8.4.3. Para un tamaflo de la muestra n = 30, se generaron 1 000 muestras aleatorias 
para cada una de las siguientes distribuciones: uniforme, exponencial y gama. Los 
valores de los parametros de cada distribucidn se seleccionaron en cada caso para 
proporcionar una varianza de 100. Para cada muestra aleatoria se probo la hipdtesis 
nula 

// 0 : cr 2 = 100 

contra la alternativa 

H,: o- 2 > 100, 

mediante el empleo de la estadistica chi-cuadrada con a = 0.05. Para cada distri¬ 
bucidn se contd el numero de veces para las que se rechazaba la hipdtesis nula. Los 
resultados se encuentran en la tabla 9.17. 

Dado que a = 0.05 representa la probabilidad de rechazar una hipdtesis cierta 
(tal cual es el caso aqui), se espera que 50 de las 1 000 muestras proporcionen esta de- 


TABLA 9.16 Criterios de rechazo para la prueba de hipotesis con respecto a la varianza de 
una distribucidn normal con media desconocida 


Hipdtesis nula 

Valor de la estadistica de prueba bajo H 0 

H 0 : a 2 = o-o 

, (n - l)s 2 

X' - 

cr 0 

Hipdtesis alternativa 

Criterios de rechazo 

H,: cr 2 j= o-|j 

Rechazar H„ cuando x’ ^ x 1 - 0 / 2 .»- 1 , 0 cuando x’ 15 Xl/i. * 1 

H t : cr 2 > cr o 

Rechazar H n cuando x" 55 Xi-«. 

H,: cr 2 < <T 2 , 

Rechazar H„ cuando x 2 ^ xl. „ -1 
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TABLA 9.17 Numero de rechazos de la hipotesis nula de entre 1 000 muestras para tres 
distribuciones de igual varianza 


Tipo de distribucidn y valores de los parametros 

Uniforme 

(0, V1200) 

Gama _ 

. Forma = 2; Escala = \/50 

Exponencial 
Media = 10 

8 

107 

156 


cision cuando se muestree una distribution normal. Sin embargo, con base en los re- 
sultados existe una discrepancia suficiente para creer que la estadistica chi-cuadrada es 
sensible a la suposicion de que el muestreo se lleva a cabo sobre una distribution nor¬ 
mal. No esta por demas notar que los resultados del estudio de simulation son de al- 
guna manera predecibles, especialmente si se comparan los facto*es de forma de las 
distribuciones seleccionadas con los de la distribution normal. La distribution uni¬ 
forme es sim etrica, al igual que la normal, pero se encuentra definida en el intervalo 
(0, V*200). Como consecuencia, la verosimilitud disminuye porque algunas 
muestras pueden contener valores extremos que pueden aumentar el valor de la va¬ 
rianza muestral. Asi, el numero de rechazos es menor que el que se espera. La distri¬ 
bution exponencial es la que tiene una mayor asimetria de entre las tres distribu¬ 
ciones seleccionadas y el mayor valor de curtosis. Por lo tanto, no es sorprendente 
que el numero de rechazos sea mucho mas grande que el correspondiente a una dis¬ 
tribution normal. La distribution gama, con parametros de forma y escala iguales a 
2 y V50, respectivamente, se encuentra entre las anteriores ya que su coeficiente de 
asimetria es V2 y su curtosis relativa es 6. 

9.7.2 Pruebas para dos muestras 

Sean X { , X 2 , .... X„ k y K,, Y 2 , .... Y„ r dos muestras aleatorias de dos distribucio¬ 
nes normales independientes con medias desconocidas px y Pr y varianzas desco- 
nocidas cr\ y a\. Considerese la prueba de la siguiente hipotesis nula 

H 0 : <t\ = a 2 r 

contra una de las siguientes alternativas: 

//,: cr.v 7^ cr >, H , : try > crj. //,: <r\ < tr\. 

Las estadisticas de interes son las varianzas muestrales S\ y S] . Por ejemplo, con 
respecto a la hipotesis alternativa bilateral, puede rechazarse la hipotesis nula si el 
estimador .v; es lo suficientemente diferente del estimador .v> . De la section 7.8, 
recuerdese que por virtud de la independencia, las cantidades (n - ILS A-/<r.; y (iiy 
- 1 ).Vj /rr 7 son dos variables aleatorias independientes chi-cuadrada con n y - 1 
y H) I grados de libertad, respectivamente. Entonces se sigue la estadistica 

f = 

S 2 ,/crj 
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tiene una distribution F con n x - I y n Y - 1 grados de libertad. Pero bajo la hi¬ 
pdtesis nula, o* = cry; de esta forma la estadistica se reduce a 

F = Si/S\. 

Para una hipdtesis alternativa bilateral y un tamaflo a del error de tipo I, se 
rechazard la hipdtesis nula cuando / = sl/s\ > f- a /i. „ f -i. „>-i o cuando 
/ l//i-„/ 2 . 1 . „ x -\- En la tabla 9.18 se proporciona un resumen completo de 
los criterios de rechazo. 

Como ilustracidn, recuerdese que en el ejemplo 9.9, se asumio que las varianzas 
eran iguales al comparar las medias para los dos niveles de ruido. Para verificar la 
validez de esta suposicidn a un nivel de a = 0.1, supdngase que se prueba la hipdte¬ 
sis 

= o-l 

contra la alternativa 

± 0-2. 

Se observa que los valores criticos, izquierdo y derecho, son ,, 15 = 2.40 y 
I// 0 . 95 . 15.15 = 1/2.40 = 0.42,respectivamente. Con base en los datos de la muestra 
s] = 5.1833 y s\ = 6.0. De esta forma el valor de la estadistica de prueba es 

/= 5.1833/6 = 0.8639. 

Dado que / = 0.8639 no es ni mayor ni igual a 2.4, ni menor o igual a 0.42, no es 
posible rechazar la hipdtesis nula. De acuerdo con lo anterior, los resultados muestra- 
les no proporcionan una razon valida para sospechar que esta siendo violada la supo¬ 
sicidn de varianzas iguales. 


TABLA 9.18 Criterios de rechazo para la prueba de hipdtesis con respecto a las varianzas de 
dos distribuciones normales independientes 


Hipdtesis nula 

Valor de la estadistica de prueba bajo H„ 

.rC 

u 

f = 'T fs] 

Hipdtesis alternativa 

Criterios de rechazo 

//,: <t\ f 07 

Rechazar //„ cuando / 5 = „ v -i, »,-!• 

0 cuando f ~ r 1 //, - 0/i . „ r 1. 1 

H t : (r; > fry 

Rechazar H„ cuando / ^ /i-„. » v -i. „,-i 

H j: (Ty < try 

Rechazar H„ cuando / =s l//i-... ■ 
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9.8 Inferencias con respecto a las proporciones de dos distribuciones 
binomiales independientes 

En la secci6n 8.4.6 se desarrollaron los criterios para la construcci6n de intervalos de 
confianza para el parametro de proporcion p, cuando se muestrea una distribucibn 
binomial. En muchas ocasiones, el interes recae en comparar la proporcibn de un 
grupo distinto con la de otro, en relacibn con alguna caracteristica en comun. Por 
ejemplo, puede tenerse interes en comparar la proporcion de unidades defectuosas 
para un producto dado, que se fabricb por dos compaflias que compiten entre si. O 
puede existir algun interes en comparar las proporciones de estudiantes de prepara- 
toria en dos localidades geograficas diferentes que tienen un numero de respuestas 
correctas para la prueba SAT por encima de cierto nivel. De esta forma, es necesario 
entender las ideas presentadas en la seccion 8.4.6 para comparar los par&metros de 
proporcion cuando se muestrean dos distribuciones binomiales independientes. 

Como ilusiracion, en un estudio reciente se compararon las proporciones de per¬ 
sonas zurdas y derechas que fuman. La poblacion general se dividib en dos grupos, 
zurdos y derechos, y cada grupo fue subdividido en f"madores y no fumadores. Sea 
p | la proporcion de personas zurdas que fuman y p 2 la proporcion de personas dere¬ 
chas que fuman. El interes recae en hacer una comparacion entre p,y p 2 - 

Supbngase que los zurdos y los derechos constituyen dos distribuciones binomia¬ 
les independientes tales que la proporcion de fumadores en los dos grupos es p, y p 2 , 
respectivamente. Con base en muestras aleatorias de tamaflo n, y n 2 , sean X y T el 
numero observado de personas zurdas y derechas que fuman, respectivamente. Las 
proporciones muestrales 


P, = X/n u 
P i = Y/n 2 

son los estimadores de maxima verosimilitud de p, y p 2 , respectivamente. Dado que 
por hipotesis X y Y son variables aleatorias binomiales, las varianzas de los estima- 
dores estan dadas por 


Var(P ,) = Vcir(X/n t ) = p,(l -/?,)/«,, 

Var(P 2 ) = Var(Y/n 2 ) = p 2 ( 1 - Pi)/n 2 . 

Supongase que se desea construir un intervalo de confianza muestral grande para 
la diferencia entre /?, y p 2 . La estadistica de interes es la diferencia entre las dos pro¬ 
porciones muestrales. Ya que 

£(P,) = p,, E(P Z ) = p 2 , 

entonces, con base en el teorema 6.1 y su corolario dado por la expresion (7.2) 


E(P i P 2 ) — p 1 Pz • 
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y 


Var(P x - P 2 ) = Var(P y ) + Var{P 2 ) 

= Pi(l - Pi) PiO - Pi) 
n \ n 2 


(9.19) 


Con base en una discusibn anterior (vbase el capltulo 5) puede demostrarse que 
en valores grandes de n { y n 2 , la distribucibn de la estadlstica P, - P 2 es, en forma 
aproximada, normal con media y varianza dadas por (9.18) y (9.19), respectivamen- 
te. En otras palabras, la distribuci6n de 



(P i P 2 ) (Pi Pz) 



- Pi) 

n 1 


- hi 

n 2 


(9.20) 


es aproximadamente (V(0>1) n , Y n 2 - Notese que el denominador en la expresion 
(9.20) proporciona un estimador de la desviacibn estbndar de la estadistica P, - P 2 , 
ya que se han reemplazado las proporciones muestrales p x y p r Por lo tanto, se sigue 
que para n x y n 2 grandes, la probabilidad del intervalo aleatorio 


[(P, - P 2 ) - z,- a/2 d.e.(P, ~ P 2 ), (Pi - Pi) + z,- a/2 s.d.(Pi ~ P 2 )\ 


es aproximadamente 1 - a, yun intervalo de confianza aproximado del 100(1 — 
a)% para p, - p 2 es: 


(p, - p 2 ) ± z ,- a/2 




Pi( 1 ~ Pi) 
«2 


(9.21) 


en donde p, = x/n x y p 2 = y/n 2 son los estimados de maxima verosimilitud de p, 
yp 2 respectivamente. 

Ejemplo 9.12 En un estudio de los hbbitos de fumador para personas zurdas y de- 
rechas, una muestra aleatoria de 400 zurdos revelb que 190 de estos fuman, y en una 
muestra aleatoria de 800 derechos, 300 de estos fuman. Con base en esta evidencia, 
construir un intervalo de confianza del 98% para la diferencia real entre las propor¬ 
ciones p , y p 2 . 


Los estimados de las proporciones son 

p, = 190/400 = 0.475, p 2 = 300/800 = 0.375. 

Dado que los tamaflos de las muestras son grandes, la aproximacion normal es ade- 
cuada para este caso. Para un intervalo de confianza del 98% Z 0.99 = 2.33 y el inter¬ 
valo de confianza es 

075 ) 


(0.475 - 0.375) ± 2.33 

WWW., 


/(0.475X1 - 0.475) (0.375)0 - 


r reeL/S 


800 
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el cual simplifica al intervalo (0.0295, 0.1705). Dado que este intervalo de confianza 
no incluye al origen y, de hecho, se encuentra a la derecha de este, puede concluirse 
con un 98% de confiabilidad, que el porcentaje de zurdos que fuman es mayor que 
el correspondiente para las personas derechas. 

Supdngase que el interes recae en probar la hipdtesis nula 

Ho- Pi ~ p 2 = 0 

contra una de las siguientes alternativas: 

Hf'. p\ — P 2 ^ 0, H\ \ p x — p 2 > 0, H\ \ P\ — p 2 < 0. 

Dadas muestras aleatorias de tamaflos n, y n 2 , considerese la estadistica P, - P 2 . 
La intuicidn sugiere que debe rechazarse la hipdtesis nula si un valor de la estadistica 
es, en forma suficiente, diferente, mayor que, o menor que cero, dependiendo de la hi¬ 
pdtesis alternativa. En forma equivalente, la decisidn puede basarse en una prueba 
estadistica similar a la dada por (9.20), la cual es aproximadamente N( 0, 1) para va- 
lores grandes de n, y n 2 . 

Dado que bajo H 0 se supone que las dos proporciones son iguales, sea p = p, = p 2 
la proporcidn comun. Entonces, si la hipdtesis nula es cierta, la estadistica P x - P 2 
tiene una distribucidn, en forma aproximada, normal con media 

E(P t -P 2 ) = 0 

y desviacion estandar 


d.e.iP, - P 2 ) = 

- ( v ^) Ui + ^)- 

Ya que el valor de p no se conoce, se combina la informacion de las dos muestras 
para obtener el estimador combinado 

X + Y 
P = ——, 
n i + n 2 

donde X y Y son las variables aleatorias que se observaron y que poseen la caracte- 
ristica de interes. Entonces un estimado de la desviacion estandar de P x - P 2 es 

+ ^). 

en donde p = (x + y)/(n , + n 2 ) es el estimador combinado de/7. Bajo //,, la esta¬ 
distica 
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I pi i - p) + pi i - p) 




«2 


(9.22) 
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es aproximadamente N(0, 1) para valores grandes de n, y n 2 . Dependiendo de la hi¬ 
potesis altemativa, el lector no debe tener dificultad para decidir cuando rechazar 
H 0 con base en (9.22) dado un tamaflo del error de tipo I. 
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Ejercicios 

9.1. Suponga que usted desea probar la hip 6 tesis 

H tl : 6 = 5 

contra la alternativa 

H ,: 9 = 8 

por medio de un solo valor que se observa en una variable aleatoria con densidad de 
probabilidad fix: 0) - (l/0)exp( -x/0), ,v > 0. Si el tamaflo maxi mo del enor de tipo 
I que puede tolerarse es de 0.15, £cual de las siguientes pruebas es la mejor para escoger 
entre las dos hipotesis? 

a) Rechazar //„ si X 9 

b) Rechazar H„ si X 10 
C ) Rechazar //„ s ils II 

9.2. Suponga que usted observa un solo valor de una variable aleatoria cuya funcion de den¬ 
sidad esta dada por fix: 6) = 1/0, 0 < x < 6. y desea probar la hipotesis 

/?„: 0 = 20 

contra la alternativa 

H s : 0 = 15. 

icual de las dos pruebas a) rechazar H tl si X =s 8. o b) rechazar //„ si X > 8 es la 
mejor para decidir entre las dos hipotesis? 

9.3. Se sabe que la proporcion de articulos defectuosos en un proceso de manufacture es de 
0.15. El proceso se vigila en forma periodica tomando muestras aleatorias de tamaflo 20 
e inspeccionando las unidades. Si se encuentran dos o mas unidades defectuosas en la 
muestra, el proceso se detiene y se considera como “fuera de control”. 

a) Enunciar las hipotesis nula y alternativa apropiadas. 

b) Obtener la probabilidad del error de tipo I. 

c) Obtener y graficar la funcion de potencia para los siguientes valores alternativos de la 

proporcion de 0.2, y-0.25. 
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d) Comp&rense sus respuestas con las partes bye para el caso en el que se juzga al pro- 
ceso como fuera de control cuando se encuentran tres o m4s defectuosas. 

9.4. La cantidad promedio que se coloca en un recipiente en un proceso de llenado se supone 
que es de 20 onzas. En forma periddica, se escogen al azar 25 recipientes y el contenido 
de cada uno de estos se pesa. Se juzga al proceso como fuera de control cuando la media 
muestral X es menor o igual a 19.8 o mayor o igual a 20.2 onzas. Se supone que la canti¬ 
dad que se vada en cada recipiente se encuentra aproximada, en forma adecuada, por 
una distribuci6n normal con una desviaci&n estandar de 0.5 onzas. 

a) Enunciense las hipdtesis nula y alternativa que son propias para esta situacidn. 

b) Obtener la probabilidad del error de tipo I. 

c) Obtener y graficar la funcion de potenda para los siguientes valores medios de llena¬ 
do: 19.5, 19.6, 19.7, 19.8, 19.9, 20.0, 20.1, 20.2, 20.3, 20.4, y 20.5. _ 

d) Como una prueba alternativa, considerese el rechazo de // 0 cuando X « 19.75 o 
cuando X & 20.25. Si el tamaflo mhximo del error de tipo I es de 0.05, £cuhl de las 
dos pruebas es la mejor? 

9.5. Con referencia al ejercicio 9.4, supongase que el tamaflo de la muestra se aumenta a 36 
recipientes. Dados los mismos tamaflos del error de tipo I para las pruebas propuestas, 
obtener los nuevos valores criticos y comparar las funciones potencia de las dos 
pruebas. 

9.6. Los siguientes datos son los tiempos de sistema observados (tiempo de espera mas tiem- 
po de servicio) para 10 clientes en una tienda: 8.7, 2.4, 18.2,10.5, 9.7, 4.8, 11.2, 29.3, 
10.8, 15.6. Supongase que el tiempo del sistema es una variable aleatoria con una distri¬ 
bution gama, con parametro de forma igual a 2 y parametro de escala 9 desconocido. 
(Sugerencia: vease la expresidn (5.51) y el teorema 7.1.) 

a) Pruebese la hipdtesis nula 

H 0 : 6 = 5 

contra la alternativa 

H,: 9 > 5, 

con un tamaflo maximo del error de tipo I igual a 0.05. 

b) Si el valor real de 9 fuese 7, icual seria la probabilidad del error de tipo II? 

9.7. Sea X ,, X 2 , .... X„ una muestra aleatoria de tamaflo n de una distribution normal con 
media m desconocida y varianza u 2 conocida. Obtener la mejor region critica de tama- 
no a para probar 

- M = fx„ 

contra 

H\' P = Mi. 

en donde Mi < Mo • 

9.8. Sea X,. X 2 . X„ una muestra aleatoria de tamaflo n de una distribucion de Poisson 

con parametro X desconocido. Obtener la mejor region critica de tamaflo a para probar 


^ ~ An 
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contra 

//,: A = A,. 

endonde.Ai < Ao. > . 

9.9. El numero de accidentes en un crucero muy transitado sigue el modelo exacto de una 
distribuci6n de Poisson con una media de 2.5 accidentes por semana. Un ingeniero de 
tr&fico decide reducir la velocidad limite de las dos avenidas que se intersectan en el cru¬ 
cero. La decision con respecto a si la reducciOn en el limite de velocidad disminuye el nu- 
mero de accidentes promedio por semana, se tomari con base en el numero total de ac¬ 
cidentes que se observan durante un periodo de cuatro semanas a partir de la reduction 
en el limite de velocidad. 

a) Enunciar las hipotesis nula y altemativa apropiadas para esta situation. 

b) Para un tamaflo maximo del error de tipo I igual a 0.1, obtener el valor critico de la 
estadistica de prueba para el rechazo de la hipotesis nula. (Sugerencia: veanse el 
ejemplo 9.4 y el ejercicio 7.6.) 

c) Si el numero de accidentes promedio disminuyO a 2, obtener la probabilidad del error 
de tipo II. 

9.10. Sea X ,, X 7 , ..., X„ una muestra aleatoria de tamaflo n de una distribution exponencial 
con par&metro de escala 8 desconocido. Obtener la mejor region critica de tamaflo a 
para probar 

//„: 0 = 6o 

contra 

donde 9 , > 0 O . 

9.11. Se seleccionaron al azar cuatro unidades de videojuegos y se probaron hasta que ocurre 
la falla de estos. El tiempo que observaron los que tuvieron las fallas son 148.2, 120.6 
165.5 y 145.7 horas. SupOngase que el lapso de tiempo que transcurre hasta que se pre- 
senta la falla es una variable aleatoria exponencial, empleese el ejemplo 7.4 para probar 
la hipOtesis nula de que el tiempo medio para que una falla ocurra es de 140 contra la al¬ 
ternative de que 6ste es mayor de 140 horas con una probabilidad del error de tipo I 
igual a 0.01. (Sugerencia: Empleese una tecnica iterativa en conjunciOn con la expresion 
(5.56).) 

9.12. Un contratista ordena un gran numero de vigas de acero con longitud promedio de 5 
metros. Se sabe que la longitud de una viga se encuentra normalmente distribuida con 
una desviacion estandar de 0.02 metros. Despues de recibir el embarque, el contratista 
selecciona 16 vigas al azar y mide sus longitudes. Si la media muestral tiene un valor mas 
pequeflo que el esperado, se tomarala decision de enviar el embarque al fabricante. 

a) Si la probabilidad de rechazar un embarque bueno es de 0.04, <,cual debe ser el valor 
de la media muestral para que el embarque sea regresado al fabricante? 

b) Si la longitud promedio real es de 4.98 metros, icual es la potencia de la prueba en el 
inciso a? 

9.13. En el ejercicio 9.12, £cual es el tamaflo necesario dela muestra para que la probabilidad 
de detectar una disminucion de 0.015 metros en la longitud, media sea de 0.99? 
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9.14. El propietario de una automovil compacto sospecha que la distancia promedio por 
gal6n que ofrece su carro es menor que la especificada por la EPA, la cual es de 30 millas 
por gal6n. El propietario observa la distancia recorrida por gal6n en nueve ocasiones y 

- obtiene los siguientes datos: 28.3, 31.2, 29.4, 27.2, 30.8, 28.7, 29.2, 26.5, 28.1. Des- 
pubs de una investigacibn el propietario concluye que la distancia por galbn es una 
variable aleatoria que se distribuye normal con una desviacibn estandar conocida de 1.4 
millas por galbn. Con base en esta informacibn, £se encuentra apoyada la sospecha del 
propietario con a = 0.01? iCual es el valor p en este caso? 

9.15. En el ejercicio 9.14, icuantas veces debe observarse la distancia recorrida por galbn para 
que con una probabilidad de 0.9 sea detectado un valor tan bajo como 28 mpg? 

9.16. En cierto condado de Iowa, la cosecha promedio de malz por acre fue de 100 toneladas 
por acre. Para un aflo dado en el que el clima fue particularmente bueno, se selecciona- 
ron 12 parcelas en forma aleatoria y estas arrojaron una cosecha promedio de 106 tone¬ 
ladas por acre, para la misma variedad de malz. Si la produccion por acre se modela en 
forma adecuada por una distribution normal con una desviacion estandar de 8 tonela¬ 
das por acre, iexiste alguna razon para creer que este aflo la produccion sera mejor que 
la produccion promedio normal? Empleese a = 0.01. Para este caso, icual es el valor 
Pi 

9.17. Para el ejercicio 9.16, obtener el correspondiente intervalo inferior de confianza del 
99% para el estimador del valor real promedio de la produccion por acre, y deducir el 
intervalo de posibles valores para p bajo la hipotesis nula para la que //„ no puede re- 
chazarse con el mismo valor de a. 

9.18. En una planta de armado se disefla una operacion especifica la cual toma un tiempo 
promedio de 5 minutos. El gerente de la planta sospecha que para un operador en parti¬ 
cular el tiempo promedio es diferente. El gerente toma una muestra de 11 tiempos de 
operacibn para este empleado y obtiene los siguientes resultados (en minutos): 4.8, 5.6, 
5.3, 5.2, 4.9, 4.7, 5.7, 4.9, 5.7, 4.9, 4.6. Si se supone que el tiempo de operacibn se 
encuentra modelado en forma adecuada por una distribucibn normal: 

a) iSe encuentra la sospecha del gerente apoyada por la evidencia con a = 0.02? £cual 
es el valor de pi 

b) Obtener el correspondiente intervalo de confianza estimado del 99% para el tiempo 
promedio real, y deducir el intervalo de posibles valores de p bajo H 0 para los que 
no puede rechazarse la hipbtesis nula. 

9.19. A veces los productos radioactivos de desecho industrial van a dar a las fuentes de agua 
que se utilizan para el consumo de la poblacion. Por razones como esta, las agencias es- 
tatales de salud vigilan en forma periodica las fuentes naturales de agua mediante la 
toma y el analisis de muestras de agua. En forma legal se ordena que la cantidad prome¬ 
dio de radiacion en el agua para beber no debe exceder el valor de 4 picocuries por litro 
de agua. Se toma una muestra de 16 especlmenes de una fuente natural de abasto de una 
zona densamente poblada, la cual proporciona valores para la media y la desviacion es¬ 
tandar muestral de 4.2 y 1.2 picocuries por litro, respectivamente. Supongase que la 
cantidad de radiacion por litro de agua se encuentra modelada, en forma aproximada, 
por una distribucibn normal. 

a) iDebe usarse un valor, en particular, pequeno para la probabilidad del error de tipo 
I en esta situacion? ^Por que? 
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b) Selecci6nese un valor de alfa y pruebense las hip6tesis adecuadas. iCudl es el valor 
de pi 

c) iDeberia preocupar la suposiciftn de normalidad? Comentese. 

9.20. En el ejercicio 9.14, supdngase que la desviatibn estindar del rendimiento en distaricia 

por gal6n no se conoce. Pruebese la misma hipbtesis del ejercicio 9.14 y comparense los 
resultados. n 

9.21. En el ejercicio 9.11, supbngase que se asume un tiempo de falla el cual se encuentra nor- 
malmente distribuido. Pruebese la misma hipbtesis del ejercicio 9.11 y comparense los 
resultados. 

9.22. Considerese la prueba de H n : p = p 0 contra //,: p ~ P\ para el parametro binomial/?, 
en donde P\ > p 0 - Mediante el empleo del lema de Neyman-Pearson, demuestrese que 
la mejor regibn critica de tamafio a se basa en el numero de exitos observados en los n 
ensayos independientes. 

9.23. Un fabricante de lavadoras afirma que sblu el 5% de todas las unidades que vende 
sufren una falla durante el primer aflo de opseracion normal. Una organization de con- 
sumidores ha pedido a 20 familias de igual numero de miembros que han adquirido 
estas lavadoras, que reporten cualquier tnal funcionamiento durante el primer aflo. A1 
final de este, solo tres familias reportaron mal funcionamiento. 

a) Si la organizacion de consumidores cree que la proporcibn de lavadoras que sufriran 
alguna falla es mas aha que el valor afirmado por el fabricante, empleese el ejercicio 
9.22 para determinar si puede rechazarse H 0 : p = 0.05 con un tamaflo maximo del 
error de tipo I de 0.1. 

b) Mediante el empleo de un metodo aproximado basado en el material de la section 
8.4.6, pruebese la hipbtesis nula y comparense las probabilidades de las estadisticas 
de prueba, asumiendo valores tan extremos o mas de los determinados, dado que H 0 
es cierta. 

9.24. Supongase que en una muestra aleatoria de 20 bebes concebidos mediante un proceso de 
fertilization in vitro, 15 son mujeres. 

a) Mediante el uso del ejercicio 9.22, determinese que tan probable es el tener 15 o mas 
mujeres, si la verdadera proportion de estas es de 0.5. 

b) Comparese la probabilidad de la parte a con la que se obtiene mediante el empleo de 
la aproximacibn normal. 

9.25. Una organizacion de salud se interesa en actualizar su information con resp>ecto a la 
proporcibn de hombres que fuman. Con base en estudios previos, se cree que la propor¬ 
cibn es del 40%. La organizacion lleva a cabo una encuesta en la que se seleccionan en for¬ 
ma aleatoria 1 200 hombres a los cuales se les preguntan sus habitos de fumador. De los 
1 200, 420 son fumadores. Emplee un metodo aproximado para determinar si esta evi- 
dencia apoya la notion de que la proporcibn de hombres que fuman es diferente del 
40% para n = 0.01. 

9.26. El responsable de la campana politica del candidato A piensa en el ambiente de las ulti¬ 
mas semanas previas a las elecciones. El piensa que su candidato se encuentra en igual 
posicion que su oponente, el candidato B, pero han ocurrido algunos reveses en forma 
reciente. El responsable lleva a cabo una encuesta en 1 500 ciudadanos.Si de los 1 500 
720 indicamuna preferencia por el candidato A, ^existe alguna razbn para creer que el can¬ 
didato A se encuentra en desventaja con relacion al candidato B? Empleese a = 0.05. 
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9.27. un fabricante desea comparar la tensidn promedio de su hilo con la de su m&s cercano 
competidor. Las tensiones de 100 hilos para cada marca se observaron bajo condiciones 
controladas. Las medias y desviaciones estandar de cada marca fueron las siguientes: 

x, = 110.8 I, = 108.2 
s, = 10.2 s 2 = 12.4. 

i v* 

Si se supone que el muestreo se llev6 a cabo sobre dos poblaciones normales e indepen- 
dientes, iexiste alguna raz6n para creer que hay una diferencia entre las tensiones 
promedio de ruptura de los dos hilos? Usese a = 0.02. <,Cual es el valor de pi (Suge- 
rencia: la estadistica dada por (8.41) en la que los estimados sj y s; reemplazan a las co- 
rrespondientes varianzas poblacionales es aproximadamente N(0, 1) para valores gran- 
des de n, y n 2 ). 

9.28. En el ejercicio 9.27, obtener las curvas de potencia y caracteristica de operation. 

9.29. Obtener una expresidn equivalente a (9.14) para probar H 0 : p x - p y = § (l contra 
H\: Px — Mr = 8| < 8 0 • 

9.30. Se cree que el promedio verbal para el numero de respuestas correctas para la prueba 
SAT para las mujeres es mayor que el de los hombres por m&s de diez puntos. Las 
muestras aleatorias para ambos sexos arrojaron los siguientes resultados: 

Hombres Mujeres 


n i 

= 125 

n, = 100 

x, 

= 480 

x 2 = 460 

Si 

= 60 

.v, = 52 


a) Si se muestrearon dos poblaciones independientes normales, <,se encuentra la creen- 
cia apoyada por la evidencia muestral con a = 0.05? ^Cuil es el valor de pi 
bj Supongase que la verdadera diferencia es de 15 puntos. ^Cual es la potencia de la 
prueba anterior? 

9.31. Mediante el empleo de los datos del ejercicio 8.32, determine si existen diferencias 
estadisticamente discernibles para la tension de ruptura de los metales producidos por 
los dos procesos con a = 0.05. iCual es el valor de pi 

9.32. A finales de la decada de los setenta se descubrio que la sustancia carcionogenica nitro- 
sodimetilamina (NDMA) se formaba durante el secado de la malta verde, la cual se 
empleaba para fabricar cerveza. A principios de los ochenta se desarrollo un nuevo pro- 
ceso para el secado de la malta, el cual minimizaba la formation de NDMA. Se tomaron 
muestras aleatorias de una cerveza domestica que se fabrico empleando ambos procesos 
de secado, y se tomaron los niveles de NDMA en partes por billon. Se obtuvieron los 
siguientes resultados: 


Proceso anterior I 6 4 5 5 6 5 5 6 4 6 7 4 


Proceso propuesto I 2 I 2 2 I 0 3 2 I 0 I 3 


si se supone que se muestrearon dos distribuciones normales independientes con varian¬ 
zas iguales, <,existe alguna razon para creer, a un nivel de a = 0.05 que ha disminuido 
la cantidad promedio de NDMA en mas de dos partes, por billon con el empleo del 
nuevo proceso? 
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9.33. Se espera que dos operadores produzcan, en promedio, el mismo numero de unidades 
terminadas en el mismo tiempo. Los siguientes datos son los numeros de unidades ter- 
minadas para ambos trabajadores en una semana de trabajo: 

Operador I Operador 2 

12 x 14 

I! ' 18 

18 18 

16 17 

13 16 

Si se supone que el numero de unidades terminadas diariamente por los dos trabajado¬ 
res son variables aleatorias independientes distribuidas normales con varianzas iguales, 
ise puede discernir alguna diferencia entre las medias a un nivel a = 0.1? 

9.34. En el ejercicio 9.33, dado que los datos son observaciones diarias sobre un periodo de 
una semana, idebe usted considerar un enfoque alternativo a este problema? Discuta las 
ventajas de este enfoque y demuestre que se obtienen resultados diferentes a los del ejer¬ 
cicio 9.33. iPor que se obtienen resultados diferentes? 

9.35. Un investigador medico se interesa en comparar la efectividad de dos dietas muy popu- 
lares, A y B. En particular, el investigador desea determinar si una dieta es mas efectiva 
para reducir el peso de las personas obesas en un lapso dado de tiempo. Discuta de ma- 
nera completa el como debe el investigador llevar a cabo su experimento. Asegurese de 
indicar las suposiciones necesarias. 

9.36. Un educador ha desarrollado una nueva prueba de aptitud mucho mas breve que la que 
se encuentra en uso. El educador desea comparar las dos pruebas. Discuta el enfoque 
que empleari el educador para hacer posible tal comparacion. 

9.37. Un fabricante desea comparar el proceso de armado comun para uno de sus productos 
con un metodo propuesto que supuestamente reduce el tiempo de armado. Se selec- 
cionaron ocho trabajadores de la planta de armado y se les pidio que armaran las unida¬ 
des con ambos procesos. Los siguientes son los tiempos observados en minutos. 


a) 

b) 

c) 


Trabajador 

Proceso actual 

Proceso propuesto 

1 

38 

30 

2 

32 

32 

3 

41 

34 

4 

35 

37 

5 

42 

35 

6 

32 

26 

7 

45 

38 

8 

37 

32 


En a = 0.05 iexiste alguna razon para creer que el tiempo de armado para el proce¬ 
so actual es mayor que el del metodo propuesto por mils de dos minutos? 
iQue suposiciones son necesarias para probar la hipotesis del inciso a, y cual es el 
valor de pi 

Obtengase un intervalo de confianza del 95% para la diferencia entre las medias de 
los tiempos de armado. 
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9.38. Se llev6 a cabo un estudio para determinar el grado en el cual el alcohol entorpece la ha- 
bilidad de pensamiento para llevar a cabo determinada tarea. Se seleccionaron al azar 
diez personas de distintas caracteristicas y se les pidi6 que participaran en el experimen- 
to. Despues de proporcionarles la information pertinente, cada persona llev6 a cabo la 
tarea sin nada de alcohol en su organismo. Entonces, la tarea volvi6 a llevarse a cabo, 
despues de que cada persona habia consumido una cantidad suflciente de alcohol para 
tener un contenido en su organismo de 0.1%. 

a) Discutir los aspectos importantes de control que el experimentador debe considerar 
al llevar a cabo el experimento. 

b) Supongase que los tiempos “antes” y “despues” (en minutos) de los diez participan- 
tes son los siguientes: 

Participante Antes Despues 


1 

28 

39 

2 

22 

45 

3 

55 

67 

4 

45 

61 

5 

32 

46 

6 

35 

58 

7 

40 

51 

8 

25 ■ 

34 

9 

37 

48 

10 

20 

30 


iPuede concluirse a un nivel de a = 0.05 que el tiempo promedio “antes” es menor 
que el tiempo promedio “despues” por mas de diez minutos? 

9.39. En el ejercicio 9.19, iexiste alguna razon para creer que la varianza en la cantidad de ra¬ 
diation en la fuente de agua es mayor de 1.25 picocuries cuadrados? Emplee a = 0.05. 

9.40. Desarrollense expresiones generales para calcular la probabilidad del error de tipo II 
cuando se prueban las hipotesis H a : cr 2 = 0-5 contra cualquiera de las dos siguientes 
altemativas //,: cr 2 > crl y //,: cr 2 < crl. 

9.41. Empleense los resultados del ejercicio 9.40 para obtener la potencia de la prueba de la 
hipotesis en el ejercicio 9.39 si cr 2 - 1.4. 

9.42. El gerente de una planta sospecha que el numero de piezas que produce un trabajador 
en particular por dia, fluctua mas alia del valor normal esperado. El gerente decide ob- 
servar el numero de piezas que produce este trabajador durante diez dias, seleccionados 
estos al azar. Los resultados son 15. 12. 8 , 13, 12, 15, 16, 9, 8 , y 14. Si se sabe que la 
desviacion estandar para todos los trabajadores es de dos unidades y si el numero de es- 
tas que se produce diariamente, se encuentra modelado en forma adecuada por una dis¬ 
tribution normal, a un nivel de a = 0.05, ^tiene apoyo la sospecha del gerente? <,Cual es 
el valor de pi 

9.43. En un proceso de llenado, la tolerancia para el peso de los recipientes es de ocho 
gramos. Para reunir este requisito, la desviacion estandar en el peso debe ser de dos gra- 
mos. Los pesos de 25 recipientes seleccionados al azar dieron como resultado una des¬ 
viacion estandar de 2.8 gramos. 

a) Si los pesos se encuentran normalmente distribuidos, determinar si la varianza de 
estos es diferente del valor necesario. Empleese a = (1.02. 
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b) iPara que valores de la varianza muestral no puede rechazarse la hipotesis nula del 
inciso <P. iSe encuentran estos valores equidistantes del valor necesario de la varian¬ 
za? iC6mo deberian ser? Comentese. 

9.44. Considerense los datos del ejercicio 9.32. Para un nivel de a = 0.05 <,existe alguna 
raz6n para pensar que las varianzas no son iguales? 

9.45. Un inversionista desea comparar los riesgos asociados con dos diferentes mercados, A y 
B. El riesgo de un mercado dado se mide por la variacion en los cambios diarios de pre- 
cios. El inversionista piensa que el riesgo asociado con el mercado B es mayor que el del 
mercado A. Se obtienen muestras aleatorias de 21 cambios de precio diarios para el mer¬ 
cado A y de 16 para el mercado B. Se obtienen los siguientes resultados: 

Mercado A Mercado B 

jf A = 0.3 = 0.4 

s A = 0.25 = 0.45 

a) Si se supone que las muestras provienen de dos poblariones normales e independien- 
tes a un nivel de a = 0.05 iencuentra apoyo la creencia del inversionista? 

b) Si la varianza muestral de A es la dada, £cual es el maximo valor de la varianza 
muestral de B con base en n = 16 que no llevara al rechazo de la hipotesis nula del in¬ 
ciso a? 

9.46. Para el ejercicio 9.33, tPuede apoyarse la opinion de que la variacion en el numero de articu- 
los terminados para el operador 2 es menor que para el operador 1 a un nivel a = 0.05? 

9.47. En un estudio reciente que abarco 25 aflos, se investigo la posible protection que pro- 
porciona la ingestion de una forma de vitamina A Uamada caroteno contra el desarrollo 
del cancer pulmonar. Se encontro que de 488 hombres que habian ingerido una baja 
cantidad de esta sustancia durante este tiempo, 14 desarrollaron cancer pulmonar, pero 
en un grupo del mismo tamaflo en el que el consumo de caroteno era mayor, solo dos 
personas desarrollaron cancer. Bajo las suposiciones apropiadas, ipuede concluirse que 
la ingestion de caroteno reduce el riesgo de desarrollar cancer pulmonar en los hombres? 
Empleese a = 0.01. ^Cual es el valor de pi Desde un punto de vista estadistico, £que 
consejo se podria dar al investigador medico que se interesa en un proyecto como este? 

9.48. Para el ejercicio 9.47, detcrminar un intervalo de confianza estimado del 99 % para la 
verdadera diferencia entre las dos proporciones. 

9.49. Un economista al servicio de una agenda estatal desea determinar si la frecuencia de de- 
sempleo en dos grandes areas urbanas del estado son diferentes. Con base en muestras 
aleatorias de cada ciudad, cada una de 500 personas, el economista encuentra 35 perso¬ 
nas desempleadas en un area y 25 en la otra. Bajo las suposiciones adecuadas y con un 
nivel a = 0.05 iexiste alguna razon para creer que las frecuencias de desempleo en las 
dos areas son diferentes? iCual es el valor de pi 

9.50. Un usuario de grandes cantidades de componentes alectricos adquiere estos principal- 
mente de dos proveedores, A y B. Debido a una mejor estructura en precios, el usuario 
hara negocio unicamente con el proveedor B si la proportion de articulos defectuosos 
para A y para B es la misma. De dos grandes lotes, el usuario selecciona al azar 125 uni- 
dades de A y 100 unidades de B; inspecciona las unidades y encuentra siete y siete 
unidades defectuosas, respectivamente. Bajo las suposiciones adecuadas y con base en esta 
information, ^existe alguna raz6n para no comprar en forma unica las componentes del 
proveedor B? Empleese « = 0.02. 
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CAPITULO DIEZ 

Pruebas de bondad de ajuste 
y analisis de tablas 
de contingencia 


10.1 Introduction 

Recuerdese que una hipdtesis estadistica es una afirmacibn con respecto a una carac- 
teristica que se desconoce de una poblacidn de interes. En el capltulo 9 fue, en forma 
exclusiva, el valor de algun parametro 9. En este capltulo se examinar&n las pruebas 
de hipdtesis estadlsticas en las que la caracteristica que se desconoce es alguna pro- 
piedad de la forma funcional de la distribucidn que se muestrea. Ademas, se discuti- 
ran las pruebas de independiencia entre dos variables aleatorias en las cuales la evi- 
dencia muestral se obtiene mediante la clasificacion de cada variable aleatoria en un 
cierto numero de categorias. 

En forma tradicional, este tipo de prueba recibe el nombre de bondad del ajuste 
ya que esta compara los resultados de una muestra aleatoria con aquellos que se es- 
pera observar si la hipotesis nula es correcta. La comparacidn se hace mediante la 
clasificacion de los datos que se observan en cierto numero de categorias y entonces 
comparando las frecuencias observadas con las esperadas para cada categoria. Para 
un tamafio especifico del error de tipo I, la hipotesis nula sera rechazada si existe una 
diferencia suficiente entre las frecuencias observadas y las esperadas. 

Vale la pena notar que para situaciones de este tipo la hipotesis alternativa es 
compuesta y, en muchas ocasiones, no se encuentra identificada en forma explicita. 
El resultado es que la funcion de potencia es muy dificil de obtener en forma analiti- 
ca. En consecuencia, una prueba de bondad de ajuste no debe usarse por si misma 
para aceptar la afirmacion de la hipotesis nula. La decision es no rechazar H 0 (mas 
que aceptarla) si la diferencia que existe entre las frecuencias observadas y esperadas 
es, en forma relativa, pequefia. 

www.FreeLibros.com 



10.2 La prueba de bondad de ajuste chi-cuadrada 363 


10.2 La prueba de bondad de ajuste chi-cuadrada r . 

Una prueba de bondad de ajuste se emplea para decidir cuando un conjunto de 
datos se apega a una distribucibn de probabilidad dada. Considerese una muestra 
aleatoria de tamaflo n de la distribucibn de una variable aleatoria X dividida en k 

clases exhaustivas y mutuamente excluyentes, y sea N t , i = 1, 2. k, el numero 

de observaciones en la i-k sima clase. Considerese la verificacibn de la hipbtesis nula 

H 0 : F(x) = F 0 (x), (10.1) 

en donde el modelo de probabilidad propuesto F 0 (jc) se encuentra especificado, de 
manera completa, con respecto a todos los parbmetros. De esta forma la hipbtesis 
nula es sencilla. Dado que se especifica F 0 (x) de manera completa, se puede obtener 
la probabilidad p , de obtener una observacibn en la /-esima clase bajo H 0 , en donde 
necesariamente , p, = 1. 

Sea nt la realizacibn de N, para / = 1, 2... k de manera t~l q-e , n, = n. La 
probabilidad de tener, de manera exacts, n, observaciones en la /-esima clase es pi' 
para / = 1,2...*. Dado que existen k categorias mutuamente excluyentes con pro- 
babilidades P\, p 2 , ..., Pk, entonces bajo la hipbtesis nula la probabilidad de la 
muestra agrupada es igual a la funcion de probabilidad de una distribucibn multino¬ 
mial determinada (6.3). 

Para deducir una prueba estadistica adecuada para H „, considerese el caso en el 
que k = 2. Este es la distribucibn binomial con una funcibn de probabilidad dada 
por(4.1)yenlaquex = p = p u n - x = n 2 , y 1 — p = Pi■ Considerese 
la variable aleatoria estandarizada 

Y = N ' ~ np ' 

V«pid - P\) 

Del capitulo 5, recuerdese que para un valor de n suficientemente grande, la distri¬ 
bucibn de Y es aproximadamente igual a la normal estandar. Adem&s, del ejemplo 
5.14 se sabe que el cuadrado de una variable aleatoria normal estandar tiene una dis¬ 
tribucibn chi-cuadrada con un grado de libertad. Entonces, la estadistica 

(N | - np ,) 2 _ (/V, - np ,) 2 (N , - np ,) 2 
np,(\-p,) np , np 2 

(N | - np ,) 2 |n - N 2 - n( I -P2)] 2 

np | np 2 

( N, - np ,) 2 ( N 2 - np 2 ) 2 

np i np 2 

= y (/V, - np,) : 

, = I np, 

tiene aproximadamente una distribucibn chi-cuadrada con un grado de libertad con- 
forme n va tomando valores cada vez mas grandes. 
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Si se sigue este tipo de razonamiento, puede demostrarse que para k 2 catego- 
rias distintas, la estadistica 


y (N, - np,) 2 

i= i np, 


( 10 . 2 ) 


tiene una distribucibn, eh forma aproximada, chi-cuadrada con k - 1 grados de li- 
bertad, si n tiene un valor suficientemente grande. N6tese que es la frecuencia 
observada en la /-esima clase, y np, es la frecuencia correspondiente que se esperaba 
bajo la hipbtesis nula. De acuerdo con lo anterior, la estadistica es la suma sobre 
todas las k clases de los cocientes de los cuadrados de las diferencias entre las fre- 
cuencias observada y esperada, y la frecuencia esperada. La estadistica dada por 
(10.2) recibe el nombre de prueba de bondad de ajuste chi-cuadrada de Pearson. Si 
existe una concordancia perfecta entre las frecuencias que se observaban y las que se 
esperaban, la estadistica tendra un valor igual a cere - po r otro lado, si existe gran dis¬ 
crepancy entre estas frecuencias, la estadistica tomari un valor muy grande. Por 
ello se desprende que para un tamailo dado del error de tipo I, la regibn critica es el 
extremo superior de una distribution chi-cuadrada con k -1 grados de libertad. 


Ejemplo 10.1 El gerente de una planta industrial pretende determinar si el numero 
de empleados que asisten al consultorio medico de la planta se encuentra distribui- 
do, en forma equitativa, durante los cinco dlas de trabajo de la semana. Con base en 
una muestra aleatoria de cuatro semanas completas de trabajo, se observo el siguien- 
te numero de consultas: 


Lunes 


Martes Miercoles Jueves Viernes 


49 35 32 39 45 


Con a = 0.05, £ existe alguna razbn para creer que el numero de empleados que 
asisten al consultorio medico, no se encuentra distribuido en forma equitativa du¬ 
rante los dlas de trabajo de la semana? 

Una distribucion uniforme implicaria que las proporciones para cada dia de la 
semana sean iguales. Por lo tanto, debera probarse la hipbtesis nula 

H 0 :p, = 0.2. i=l,2 .5. 

Dado que el tamailo de la muestra es n = 200, la frecuencia esperada para cada dia 
es np/ = 40. Entonces, el valor de la estadistica de prueba es 

, (49 - 40)- (35 - 40) : (32 - 40) 2 (39 - 40) 2 (45 - 40) 2 

X — ... 3" * — - 4- - 4 - 4 - — 4.9. 

40 40 40 40 40 

Para k = 5 clases, se observa que el valor critico es X 0 . 95 . 4 = 9.49. Ya que x l - 4.9 
< X 0 . 95 . 4 = 9.49, no puede rechazarse la hipotesis nula. Con base en esta eviden- 
cia, no existe ninguna razon para creer que el numero de empleados que acuden al 
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consultorio no se encuentre distribuido en forma uniforme a lo largo de la semana 
de trabajo. 

Una ventaja de la prueba de bondad de ajuste chi-cuadrada es que para valores 
grandes de n, la distribucibn limite chi-cuadrada de la estadistica, es independiente a 
la forma de la distribucibn propuesta F 0 (x) bajo H 0 . Como resultado se tiene que la 
prueba de bondad de ajuste chi-cuadrada tambien se emplea en situaciones en las 
que F 0 {x ) es continua. Sin embargo, debe hacerse enfasis en que la naturaleza de la 
prueba de bondad de ajuste chi-cuadrada es discreta en el sentido en el que esta com- 
para las frecuencias que se observan y se esperan para un numero finito de catego- 
rias. De acuerdo con lo anterior, si F 0 (x) es continua, la prueba no compara las fre¬ 
cuencias que se observan alisadas con la funcibn de densidad propuesta tal como lo 
implica la hipotesis nula. Mas bien, la comparacibn se lleva a cabo aproximando la 
distribucion continua bajo H 0 con un numero finito de intervalo de clase. A pesar 
de esta limitacibn, la prueba de bondad de ajuste chi-cuadrada es un procedimiento 
razonablemente adecuado para probar suposiciones de normalidad siempre y cuan- 
do el tamaflo de la muestra sea, en forma moderada, grande. Con respecto a la pre- 
gunta de que tan grande debe ser el tamaflo de la muestra, se ha encontrado que con 
n igual a cinco veces el numero de clases, los resultados son aceptables. Una regia 
conservadora a seguir es el seleccionar un muestra de manera tal que toda frecuencia 
esperada no sea menor que cinco. Lo anterior puede lograrse combinando clases ve- 
cinas pero, para cada par de clases que se combina, el numero de grados de libertad 
debe reducirse en uno. 

A menos que pueda especificarse una hipotesis alternativa que consista en un mo- 
delo alternative FJx) particular, la potencia de la prueba de bondad de ajuste chi- 
cuadrada es muy dificil de determinar en forma analitica. Sin embargo, puede de- 
mostrarse que la potencia tiende a 1 conforme n tiende a *>. Este resultado implica 
que para muestras de gran tamaflo es casi seguro el rechazar la hipotesis nula debido 
a que es muy dificil especificar una H 0 lo suficientemente cercana a la verdadera dis¬ 
tribucion. De esta forma, la aplicabilidad de la prueba de bondad de ajuste chi- 
cuadrada es cuestionable cuando se tienen muestras de tamaflo muy grande. 

Ejemplo 10.2 En la tabla 5.2 se proporcionan los datos que se agrupanpara el nu¬ 
mero de respuestas correctas para la prueba SAT de matematicas, de los alumnos del 
tercer aflo de preparatoria. Recuerdese que en el ejemplo 5.5 se compararon las fre¬ 
cuencias que se observaron con las que se esperaron, en donde estas ultimas se obtu- 
vieron con base en una distribucion normal con media 491 y desviacion estandar 
igual a 120. Con base en la prueba de bondad de ajuste chi-cuadrada, iexiste alguna 
razon para creer que el numero de respuestas correctas para la prueba de matemati¬ 
cas SAT no se encuentran distribuidas normalmente con media 491 y desviacion es¬ 
tandar igual a 120 a un nivel de a = 0.01? 

Considerese la prueba de la siguiente hipotesis nula 

//„: Fix ) = F 0 (x), 

en donde F 0 (x) Cs el modelo de probabilidad normal con media 491 y desviacion es¬ 
tandar 120. Bajo la hipotesis nula, las frecuencias esperadas para las 12 clases se 
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encuentran en la ultima columna de la tabla 5.2. £stas se determinaron primero con- 
virtiendo cada intervalo de cada clase al correspondiente intervalo normal est&ndar, 
empleando para esto p = 491 y a = 120. Despues se determin6 la probabilidad de 
cada intervalo bajo H 0 . Finalmente, para cada clase,el valor de probabilidad se mul¬ 
tiplied por el tamafio de la muestra n = 478 193 para obtener la frecuencia esperada. 
Ndtese que las probabilidades que aparecen en la penultima columna de la tabla 5.2 
no suman uno. Pero bajo la hipdtesis nula las clases deben ser exhaustivas, de mane- 
ra tal que , p, = 1. Lo anterior puede lograrse mediante el ajuste de las clases 
primera y ultima de manera tal que la primera no tenga limite inferior y la ultima no 
tenga limite superior. Dado que bajo H 0h X ~ /V(491,120), 

P(X =s 250) = P(Z « -2.01) = 0.0222, 

y la frecuencia modificada para la primera clase es (478 193) (0.0222) = 10 615.88. 
De manera similar para la ultima clase 

P(X s* 750) = P(Z 5* 2.16) = 0.0154, 

lo cual da como resultado una frecuencia esperada de 7 364.17. 

Con base en las 12 clases, el valor de la estadistica chi-cuadrada es 

, (3 423 - 10 615.88) 2 (18 434 - 16 115.10) 2 (6 414 - 7 364.17) 2 

} ~ 10 615.88 + 16115.10 + + 7 364.17 

= 13 067.02, 

el cual se encuentra, en forma clara, mas alia del valor critico x 2 o.v>. n = 24.75. De 
acuerdo con lo anterior, la hipotesis nula de que el numero de respuestas correctas 
para la prueba SAT se encuentra normalmente distribuido con media 491 y desvia- 
cion estandar de 120, debe rechazarse. Este ejemplo ilustra el comentario formulado 
con anterioridad con respecto a muestras de gran tamafio, en donde la hipotesis nula 
casi seguramente resulta rechazada. 

Recuerdese que la hipotesis nula dada por (10.1) es simple ya que el modelo de pro¬ 
babilidad propuesto F u (x) se especifico de manera completa con respecto a todos 
sus parametros. Sin embargo, para muchas aplicaciones que toman en cuenta la 
bondad del ajuste, solo puede especificarse la forma de F ( ,(.v). Por ejemplo, supon- 
gase que se desea probar la hipotesis nula de que un conjunto de observaciones de 
una medida de interest se ajustan a una distribution normal, pero no puede especi¬ 
ficarse el valor de la media o el de la variaza. Lo anterior da como resultado que la 
hipotesis nula 


//«: FU) = F„(.v) 

es compuesta. En consecuencia, se tiene que las frecuencias esperadas np, para las i 
= 1,2 ... k clases no pueden determinarse, ya que estas son funciones de los para¬ 
metros desconocidos de F„(.r). 

Supongase que T es una estadistica para un parametro desconocido 0 de F„(.\r). 
En el contexto de la prueba de bondad de ajuste, tanto las frecuencias observables 
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N, como las frecuencias esperadas np,(T) son variables aleatorias, en donde p t (T) 
indica que las probabilidades bajo la hipbtesis nula son funciones de la estadlstica T 
de 0. Puede demostrarse que si para cualquier pariunetro desconocido 9 la estadlsti¬ 
ca T es el estimador de maxima verosimilitud de 9, y si las frecuencias esperadas se 
determinan como funciones de los estimadores de maxima verosimilitud, entonces 


y [N < - wADl 

np,(T) 


(10.3) 


tiene aproximadamente una distribution chi-cuadrada con k - 1 - r grados de liber- 
tad, para valores de n grandes, en donde r es el numero de parametros que se esta 
tratando de estimar. 

A1 igual que en el caso previo en el que se tenia una //„, sencilla, la regibn critica 
es el extremo superior de la distribucibn chi-cuadrada. Pero, a diferencia del caso 
anterior, el nun.erc ie grados de libertad se reduce por una cantidad igual al numero 
de parametros que se est&n estimando. Como consecuencia, existe un corrimiento 
hacia la izquierda en el valor critico para el mismo tamaflo del error de tipo I, y la hi¬ 
pbtesis nula puede rechazarse para un valor observado mas pequefto de (10.3) que en 
el caso previo. Lo anterior es lbgico ya que el ajuste deberii ser mejor debido a que 
los parametros desconocidos se estiman con base en las observaciones de la muestra. 

Las caracteristicas importantes para la aplicacion de la prueba de bondad de 
ajuste chi-cuadrada para el caso compuesto son identicas a las que tienen para la hi¬ 
pbtesis nula simple. Surge un problema relativamente pequefto al decidir si los para¬ 
metros desconocidos deberan estimarse con base en los datos que se agruparon en 
los que no. En forma teorica, ninguno de los dos enfoques puede ser el correcto de¬ 
bido a que los estimados de maxima verosimilitud deben obtenerse maximizando la 
funcion de verosimilitud con base en la distribucion multinomial. En forma afortu- 
nada, resulta que la mayoria de las veces el error que se comete no es serio. De esta 
forma, se pueden utilizar los estimados de maxima verosimilitud obtenidos, ya sea 
de ios datos agrupados o de los no agrupados, en forma segura. 


Ejemplo 10.3 Recuerdese el ejemplo 4.5 en el que se compararon el numero de 
anotaciones de seis puntos por equipo y por juego en la NFL con el numero que es- 
peraban de estos, si el numero de anotaciones de seis puntos tiene una distribucion 
de Poisson. Con base en la informacion contenida en la tabla 4.3, ^existe alguna 
razon para creer, a un nivel de 0.05, que el numero de anotaciones no es variable 
aleatoria de Poisson? 

Dado que el valor del parametro de Poisson X no se especifica, el estimado de 
maxima verosimilitud de X con base en la informacion que se proporcionb en la 
tabla 4.3 es X = 2.435. Bajo la hipbtesis nula de una distribucion de Poisson, la pro- 
babilidad de tener cero anotaciones es 

p(0) = (2.435)° exp(-2.435)/0! = 0.0876. 

Para n = 448, el numero esperado de cero anotaciones es (448)(0.0876) = 39.24. Si 
se sigue este procedimiento, pueden obtenerse las demas frecuencias esperadas. En 
la tabla 10.1, se presenta el calculo de la estadlstica chi-cuadrada. 
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TABLA 10.1 C&lculo de la estadistica chi-cuadrada para el ejemplo 10.3 


Numero de 
anotaciones 

Frecuencia 

observada 

Frecuencia 

esperada 

to-«/?,(A)] 2 
np,(K) 

0 

35 

39.24 

0.458 

1 

99 

95.56 

0.124 

2 

104 

116.34 

1.309 

3 

110 

94.44 

2.564 

4 

62 

57.48 

0.355 

5 

25 

28.00 

0.321 

6 

10 

11.38 

0.167 

7 

3 

5.56 

1.179 

Totales 

448 

448 

6.477 


Para k = 8 categorias y con un parametro estimado, el numero de grados de li- 
bertad es 6. Para a = 0.05 el valor critico es Xo. 95.6 = 12.60. Dado quex 2 = 6.477 
< X0.95 .6 = 12.60, no puede rechazarse la hipotesis nula de que el numero de 
anotaciones de seis puntos por equipo en la NFL es una variable aleatoria de Pois¬ 
son. 


10.3 La estadistica de Kolmogorov-Smirnov 

Recuerdese que para aplicar la prueba de bondad de ajuste chi-cuadrada cuando 
el modelo propuesto bajo H 0 es continuo, es necesario aproximar F 0 (x) medianteel 
agrupamiento de los datos observados en un numero finito de intervalos de clase. 
Este requisito de agrupar los datos implica tener una muestra de tamafto mas 0 
menos grande. De esta manera, la prueba de bondad de ajuste chi-cuadrada se en- 
cuentra limitada cuando F 0 (x) es continua y la muestra aleatoria disponible tiene un 
tamaflo pequeflo. Una prueba de bondad de ajuste mas apropiada que la chi-cuadra¬ 
da cuando F 0 (x) es continua, es la basada en la estadistica de Kolmogorov-Smirnov. 
La prueba de Kolmogorov-Smirnov no necesita que los datos se encuentren agrupa- 
dos y es aplicable a muestras de tamafto pequeflo. Esta se basa en una comparacion 
entre las funciones de distribucion acumulativa que se observan en la muestra orde- 
nada y la distribucibn propuesta bajo la hipbtesis nula. Si esta comparacion revela 
una diferencia suficientemente grande entre las funciones de distribucion muestral y 
propuesta, entonces la hipbtesis nula de que la distribucion es F 0 (.r), se rechaza. 

Considerese la hipotesis nula por (10.1), en donde F 0 (.v) se especifica en forma 

completa. Denotense por A',,,, X tl .. X {n) a las observaciones ordenadas deuna 

muestra aleatoria de tamafto n y definase la funcion de distribucion acumulati¬ 
va muestral conio 


S„(x) = 


0 x<x (t) , 

k/n x u> * < x a+ u , 

-v 3= 
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En otras palabras, para cualquier valor ordenado x de la muestra aleatoria, S„U)es la 
proporci6n del numero de valores en la muestra que son iguales o menores a x. Ya 
que F 0 (x) se encuentra completamente especificada, es posible evaluar a F 0 (x) para 
algun valor deseado de x, y entonces comparar este ultimo con el valor correspon- 
diente de 5„(x). Si la hipbtesis nula es verdadera, entonces es 16gico esperar que la 
diferencia sea relativamente pequefia. La estadistica de Kolmogorov-Smimov se de¬ 
fine como 

D n = mAx | $„(*) - F 0 (x)\. (10.5) 

X 

La estadistica D n tiene una distribution que es independiente del modelo pro- 
puesto bajo la hipotesis nula. Por esta razon, se dice D n es una estadistica indepen¬ 
diente de la distribution. Lo anterior da como resultado que la funciOn de distribu¬ 
tion de D n pueda evaluarse s61o en funciOn del tamafio de la muestra y despubs usarse 
para cualquier F 0 (x). En la tabla J del apendice, se proporcionan los valorem cvanti- 
les superiores de D n para varios tamaflos de la muestra. El lector debe notar que los 
valores asintOticos de d n que se encuentran en la parte inferior de la tabla propor¬ 
cionan una adecuada aproximacibn para valores de n mayores de 50. 

Para un tamaflo a del error de tipo I, la region critica es de la forma 


P[ D„ > 



De acuerdo con lo anterior, la hipbtesis H 0 se rechaza si para algun valor x observa- 
do el valor de D n se encuentra dentro de la regibn critica de tamaflo a. 

Como se hizo notar anteriormente, la estadistica de Kolmogorov-Smimov es, en 
general, superior a la prueba de bondad de ajuste chi-cuadrada cuando los datos in- 
volucran una variable aleatoria continua, debido a que no es necesario agrupar los 
datos. Ademas, la prueba de Kolmogorov-Smimov tiene la atractiva propiedad de 
ser aplicable a muestras de tamaflo pequeflo. Por otro lado, la estadistica se encuen¬ 
tra limitada, ya que el modelo propuesto bajo// 0 debe especificarse en forma com- 
pleta. La estadistica de Kolmogorov-Smirnov no se aplica a todos aquellos casos 
para los que las observaciones no son inherentemente cuantitativas a consecuencia 
de las ambiguedades que pueden surgir cuando se ordenan las observaciones. 


Ejemplo 10.4 A continuation se proporcionan los valores ordenados de una 
muestra aleatoria del numero de respuestas correctas para la SAT que se aplicb a 
todos los estudiantes que ingresaron a una universidad: 852, 875, 910, 933, 957, 
963, 981, 998, 1007. 1010, 1015, 1018, 1023, 1035, 1048, 1063. En aftos anterio- 
res, el numero de respuestas correctas estaba representado, en forma adecuada, por 
una distribution normal con media 985 y desviacion estandar 50. Con base en esta 
muestra, <,existe alguna razon para creer que ha ocurrido un cambio en la distribu¬ 
tion de respuestas correctas para la prueba SAT en esta universidad? Empleese un 
nivel a = 0.05. 


Sea X la variable aleatoria que representa el numero de respuestas correctas para 
la prueba SAT. Considerese la prueba de la siguiente hipbtesis nula 
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H 0 : F(x) = F 0 (x), 

donde F 0 (x) es la funci6n de distribuci6n normal con media 985 y desviacidn estan- 
dar 50. Dado que X es una variable aleatoria continua y el tamaflo de la muestra de 
X es pequefto, se usara la estadistica de Kolmogorov-Smimov para probar a H 0 . La 
funcion de distribution muestral se obtiene mediante el empleo de (10.4) para los va- 
lores ordenados. Lo anterior involucra un incremento de 1/6 = 0.0625 al valor pre- 
vio de la distribution muestral. Los valores correspondientes del modelo normal 
propuesto se obtienen estandarizando primero a N(0, 1) y empleando la tab la D del 
apendice. En la tabla 10.2 se encuentra la information mas importante. 

Se observa que la maxima desviacion es de 0.1207. De la tabla J del apendice, el 
valor critico de D [b para a = 0.05 es 0.328. Dado que 0.1207 < 0.328, nopuede 
rechazarse la hipotesis nula. De acuerdo con ello no es posible detectar un cambio en 
la distribution para el numero de respuestas correctas de la prueba SAT de la ya es- 
tablecida A f (985, 50). 


10.4 La prueba chi-cuadrada para el analisis de tablas de 
contingencia con dos criterios de clasificacion 

Muchas veces surge la necesidad de determinar si existe alguna relation entre dos 
rasgos diferentes en los que una poblaciOn ha sido clasificada y en donde cada rasgo 
se encuentra subdividido en cierto numero de categorias. Por ejemplo, ^existe una 
relaciOn entre el fumar cigarrillos y la predisposition a desarrollar cancer pulmo- 
nar?, o tambien ^existe una relaciOn entre la filiation politica y la opinion con res- 
pecto a incrementar el presupuesto armamentista? En ambos ejemplos, se ha clasifi- 
cado a la poblaciOn en dos caracteristicas y en donde se supone que cada una de 


TABLA 10.2 Calculo de la estadistica de Kolmogorov-Smimov para el ejemplo 10.4 


Valores ordenados 

■Six) 

Fo(x) 

|S„(jt) - F 0 (x)j 

852 

0.0625 


0.0586 

875 

0.1250 


0.1111 

910 

0.1875 

0.0668 

0.1207 

933 

0.2500 

0.1492 

0.1008 

957 

0.3125 

0.2877 

0.0248 

963 

0.3750 

0.3300 

0.0450 

981 

0.4375 

0.4681 

0.0306 

998 

0.5000 

0.6026 

0.1026 

1007 

0.5625 

0.6700 

0.1075 

1010 

0.6250 

0.6915 

0.0665 

1015 

0.6875 

0.7257 

0.0382 

1018 

0.7500 

0.7454 

0.0046 

1023 

0.8125 

0.7764 

0.0361 

1035 

0.8750 

0.8413 

0.0337 

1048 

0.9375 

0.8962 

0.0413 

1063 

1.0000 

0.9406 

0.0594 
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estas tiene por lo menos dos categorias exhaustivas y mutuamente excluyentes. En el 
primer ejemplo las dos caracteristicas son, si se es fumador, y si desarrolla cancer 
pulmonar. Las categorias para estas dos caracteristicas podrian ser si se es fumador 
crdnico, moderado o no fumador, para la primera, y el si se desarrolla o no c&ncer 
pulmonar para la segunda. 

Cuando una muestra aleatoria que se obtiene de una poblacidn se clasifica de 
esta manera, el resultado recibe el nombre de tabla de contingencia con dos criterios 
de clasificacidn. Esta tabla se forma por las frecuencias relativas que se observaron 
para las dos clasificaciones y sus correspondientes categorias. A pesar de que s61o se 
analizaran tablas de contingencia con dos clasificaciones, es posible analizar tablas 
que contengan mas de dos clasificaciones. 

El analisis de una tabla de este tipo supone que las dos clasificaciones son inde- 
pendientes. Esto es, bajo la hipotesis nula de independencia se desea saber si existe 
una diferencia suficiente entre las frecuencias que se observan y las correspondientes 
frecuencias que se esperan, tal que la hipbtesis nula se rechace. La prueba chi-cua¬ 
drada, discutida en la seccidn 10.2, proporciona los medios apropiados para anali¬ 
zar este tipo de tablas. 

Sea n una muestra aleatoria de una poblacion que se clasifica de acuerdo con dos 
caracteristicas A y B, cada una de las cuales contiene un numero r y c de categorias, 
respectivamente. Ademas, sea N ij el numero de observaciones en la categoria (/, y), 
de las caracteristicas A y B, respectivamente, para / = 1, 2 ... ryj = 1, 2 ... c. En- 
tonces una tabla de contingencia es un arreglo matricial de r x c, dado en la tabla 
10.3, en donde las entradas representan las realizaciones de las variables aleatorias 
N 0 . 

Notese que el total del /-esimo renglon es la frecuencia de la /-esima categoria de 
caracteristica A, sumando sobre todas las categorias de la caracteristica B. De mane¬ 
ra similar, el total de lay'-esima columna es la frecuencia observada de la y'-esima ca¬ 
tegoria de B sumada sobre todas las categorias de A. Sean 


n,. = 2 Ojj 

II 

• , r, 

j= i 



r 



HI 

ii 

•r-. 

j = 1,2, .. 

., c 


TABLA 10.3 Tabla de contingencia con dos clasificaciones 



Categorias 

Caracteristica B 

Totales 

1 

2 


c 


1 

«n 

fli: 


r>u 

n, 

Caracteristica 

2 


nr2 


n 2( 

n 2 . 

A 








r 

«rl 

n.2 


n n 

n r 


To tales 

n i 

n 2 


n. t 

n 
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los slmbolos para denotar las sumas de los renglones y de las columnas, respectiva- 
mente, en donde la notaribn “punto” indica el subscripto sobre el cual se lleva a 
cabo la sumatoria. 

Sea p,-j la probabilidad de que un objeto seleccionado al azar de una poblacibn 
de interfcs se encuentre en la categoria (i, j) de la tabla de contingencia. Sea p, la pro¬ 
babilidad (marginal) de que un objeto se encuentre en la categoria i de la caracteristi- 
ca A, y sea p.j la probabilidad de que un objeto se encuentre en la categoria / de la 
caracteristica B. Si las dos caracteristicas son independientes, la probabilidad con- 
junta debe ser igual al producto de las probabilidades marginales. De esta forma 
puede establecerse la hip6tesis nula de la siguiente manera: 

//«: Pij = PiPj i - 1.2. r; j = 1, 2, .... r. (10.6) 

Si pueden especificarse las probabilidades marginales p, yp ; , entonces, bajo la 
hipdtesis nula, la estadistica 


22 


(jV„ - n Pi p t ) 2 

np,Pj 


(10.7) 


tiene en forma aproximada una distribucion chi-cuadrada con rc - 1 grados de liber- 
tad para valores grandes de n. Sin embargo, la mayoria de las veces pueden no cono- 
cerse los valores de las probabilidades marginales y, de esta forma, se estiman con 
base en la muestra. Afortunadamente, la prueba de bondad de ajuste chi-cuadrada 
permanece como la estadistica apropiada para probar (10.6), siempre que se empleen 
los estimados de maxima verosimilitud y se reste un grado de libertad del total para 
cada parametro que se este estimando. Dado que , p,. = 1 y p. t - l.existen r 
- 1 parametros de renglon y c -1 de columna a ser estimados. De esta forma, el nu- 
mero de grados de libertad sera rc — 1 - (r - 1) - (c - I) = rc - r - c + 

1 = (r - 1 )(r - 1). 

Puede demostrarse que los estimados de maxima verosimilitud de p, y p , est^n 
dados por 


P, = ",/n. 

(10.8) 

P, = njn. 

(10.9) 


respeetivamente. Al sustituir (10.8) y (10.9) en (10.7), se obtiene la estadistica 


21 



(10 10 ) 


que para valores grandes de n es, en forma aproximada, una variable aleatoria chi-cua¬ 
drada con (r - 1) x (c - 1) grados de libertad. 
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Ejemplo 10.5 Una compafiia evalua una propuesta para fusionarse con una corpo- 
raci6n. El consejo de directores desea muestrear la opinidn de los accionistas para 
determinar si esta es independiente del numero de acciones que cada uno posee. Una 
muestra aleatoria de 250 accionistas proporciona la information que se muestra en 
la tabla 10.4. Con base en esta information, ^existe alguna razon para dudar de que la 
opinion con respecto a la propuesta es independiente del numero de acciones que 
posee el accionista? Usese a = 0.10. 

La hipotesis nula se establece de la siguiente forma 

H 0 : Pij = Pip.j, i = 1, 2, 3; j = 1, 2, 3. 


En esta, p u es la probabilidad de que un accionista seleccionado al azar se encuentre 
en la categoria (i, j); p,. es la probabilidad marginal de que el numero de acciones 
que posee un accionista seleccionado al azar se encuentre en la categoria /; y p.j es la 
probabilidad marginal de que un accionista seleccionado al azar tenga una opinion/ 
Por la c '.presibn (10.10) la frecuencia esperada de la celda (/, J) es el producto del 
total de z'-esimo renglon por el total de lay'-esima columna dividido por el tamafio de 
la muestra n = 250. Por ejemplo, el numero esperado de accionistas que estan a 
favor de la propuesta y que poseen mas de 1 000 acciones, es (95)(100)/250 = 38. 
Al continuar este proceso, se determinan las frecuencias esperadas para cada combi¬ 
nation. En cada celda de la tabla 10.5, la primera linea representa la frecuencia ob- 
servada, la segunda la frecuencia esperada y la tercera la contribution de cada celda 
al valor de la estadistica, deacuerdo con (10.10). 

De esta manera, el valor de la estadistica es 


(38 - 30.4) 2 (29 - 39.52) 2 (4 - 7.6) 2 

30.4 + 39.52 + + 7.6 


10.80. 


Dado que r = c = 3, el numero de grados de libertad es 4. Para a = 0.1, el 
valor critico es x 2 o ■?, 4 = 7.78. De esta forma, el valor que se observa de la estadis¬ 
tica de prueba se encuentra dentro de la regi6n critica, y la hipotesis nula debe recha- 
zarse. De acuerdo con lo anterior, existe una raz6n para creer que la opinion con res¬ 
pecto a la propuesta y el numero de acciones que cada accionista posee, no son inde- 
pendientes. 


TABLA 10.4 Datos muestrales para el ejemplo 10.5 


Numero de 
acciones 


Opinidn 


Totales 

A favor 

En contra 

Indecisos 

Menos de 200 

38 

29 

9 

lb 

200-1000 

30 

42 

7 

79 

Mas de 1000 

32 

59 

4 

95 

S 

Tot ales 

100 

130 

20 

250 
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TABLA 10.5 Frecuencias esperadas y observadas para el ejemplo 10.5 


Numero de acciones 

A favor 

En contra 

Indecisos 

Totales 


38 

29 

9 

76. 

Menos de 200 

30.40 

39.52 

6.08 

76 

i 

1.90 

2.80 

1.40 

6.10 


30 

42 

7 

79 

200-1000 

31.60 

41.08 

6.32 

79 


0.08 

0.02 

0.07 

0.17 


32 

59 

4 

95 

Masde 1000 

38 

49.40 

7.60 

95 


0.95 

1.87 

1.71 

4.53 


100 

130 

20 

250 

Totales 

100 

130 

20 

250 


2.93 

4.69 

3.18 

10.80 
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Ejercicios 

10.1. Con base en los registros de una tienda de modas, el 50% de los vestidos adquiridos 
por esta para la temporada se vender^n a precio de menudeo, el 25% a un 20% menos 
del precio de menudeo, 15% se venderan despues de una reduction en su precio del 
40% y los restantes con una disminucion en su precio del 60%. Para esta temporada, se 
adquirieron 300 vestidos y su venta fue en la siguiente forma: 

Precio de venta 20% de 40% de 60% de 

140 90 30 40. 

iExiste alguna razon para creer que la disminucion en ventas fue diferente en esta tem¬ 
porada con respecto a las anteriores? Usese a = 0.05. <,Cual es el valor de pi 

10.2. En un hospital, el numero de nacimientos observados para cada mes de cierto aflo, 
fueron los siguientes: 

Ene Feb Marzo Abril Mayo Jun Julio Ago Sept Oct Nov Die 
95 105 95 105 90 95 105 110 105 100 95 100 

Si a = 0.01, iexiste alguna razon para creer que el numero de nacimientos no se en- 
cuentra distribuido en forma uniforme durante todos los meses del aflo? ^Cual es el 
valor de pi 
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10.3. En el ejercicio 10.2, supdngase que el numero de nacimientos que se observaron cada 
mes durante un periodo de 10 aflos es simplemente igual a diez veces los numeros ob- 
servados en el ejercicio 10.2 para un aflo. 

a) iCambiar4 esto la conclusion del ejercicio 10.2? 

b) iQue puede concluirse con respecto al empleo de prueba de bondad de ajuste chi- 
cuadrada para valores grandes de ril 

10.4. Un fabricante asegura que produce s61o el 5% de unidades defectuosas. Un comprador 
de grandes cantidades de estas unidades selecciona 100 y encuentra diez defectuosas. 

a) Mediante el empleo de la prueba de bondad de ajuste chi-cuadrada, determinar si 
existe una raz6n para dudar de la afirmaciOn del fabricante. Osese a = 0.05. 

b) Comp&rese la respuesta con la parte a, que se obtiene al utilizar el metodo aproxi- 
mado que se discutio en el capitulo 9 para probar la hipdtesis nula de que la verda- 
dera proporcion de articulos defectucsos es 0.05. 

c) iExiste alguna relacion entre los valores de las estadisticas de prueba obtenidos en 
las partes ay bl ^Existe alguna condiciOn para esta relacion? 

10.5. Una organizacion de seguridad vial desea determinar si el numero de accidentes fatales 
se encuentra distribuido de igual forma para el color de los automoviles involucrados 
en los accidentes. La organizacion obtuvo una muestra aleatoria de 600 accidentes 
automovilisticos en los cuales ocurrio por lo menos una muerte y anoto el color del 
automovil. Se obtuvo la siguiente information: 

Rojo Cafe Amarillo Blanco Gris Azul 

75 125 70 80 135 115 

iExiste alguna razon para creer que las proporciones de color no son identicas? Usese 

a = 0.01. 

10.6. Durante un periodo de 30 aflos se llevo a cabo un estudio medico para determinar, 
entre otras cosas, si los habitos de fumador pueden influenciar en el desarrollo de la en- 
fermedad cardiaca. Durante este periodo, 160 hombres desarrollaron alguna enferme- 
dad cardiaca. Estos hombres fueron clasificados como fumadores agudos (mas de dos 
cajetillas de cigarros al dia), fumadores moderados (una a dos cajetillas al dia), fuma¬ 
dores ocasionales (menos de una cajetilla al dia) o no fumadores. El numero de 
hombres en cada categoria que desarrolld alguna enfermedad cardiaca es el siguiente: 

Fumador Fumador Fumador 

agudo moderado ocasional No fumador 

58 54 36 12 


a) Si se supone que al comienzo del estudio habia una cantidad igual de hombres en 
cada una de las cuatro categorias, ^existe alguna razon a un nivel de ot = 0.01 para 
creer que las proporciones en estas categorias no son las mismas? 

b) iComo se podria prevenir al investigador medico del uso de la prueba de bondad de 
ajuste chi-cuadrada en esta situacirin? 


10.7. 


En un proceso de produccion se toma una muestra aleatoria diaria de 100 articulos y se 
i’nspecciona para encontrar articulos defectuosos. Para una semana dada y para los 
cinco dias de operacion, se observo el siguiente numero de unidades defectuosas. 
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Lunes Maries Miercoles Jueves Viernes 

12 7 6 5 10 

Si el porcentaje total de articulos defectuosos es del 8%, ipuede concluirse que a un 
nivel de a = 0.05 existe una diferencia discernible en el porcentaje diario de articulos 
defectuosos? 

10.8. Con referencia a los datos del ejercicio 1.1, empleando la prueba de bondad de ajuste 
chi-cuadrada, ipuede concluirse que los lapsos de tiempo no se encuentran exponen- 
cialmente distribuidos con d = 3.2 minutos? Usese a = 0.01. 

10.9. Considere los datos del ejercicio 1.7. 

a) Para a = 0.05. empleese la prueba de bondad de ajuste chi-cuadrada para probar 
la hipbtesis nula de que la distribution del numero de anotaciones de seis puntos 
por equipo y por juego en la NFL, es una distribution de Poisson con parametro 
K = 2.7. 

b) Supongase que se estima el valor de X a partir de los datos. iComo podria este cam- 
bio efectuar la respuesta a la parte o? 

10.10. Usese la estadistica de Kolmogorov-Smirnov en los datos del ejercicio 1.1 y compare el 
resultado con el que se obtiene en el ejercicio 10.8. 

10.11. Usese la estadistica de Kolmogorov-Smirnov para probar la hipotesis nula de que los 
datos del ejercicio 1.2 se encuentran normalmente distribuidos con media 50 y desvia- 
ci6n estandar 10. Usese a = 0.05. 

10.12. Como se noto con anterioridad, una limitation de la estadistica de Kolmogorov- 
Smirnov es que debe especificarse el modelo propuesto bajo //„. A pesar de que no se 
encuentra disponible ningun metodo cuando algunos de los parametros no se especifi- 
ca, Lilliefors* obtuvo los limites de rechazo a traves de un estudio de simulation para 
el problema especifico de probar la normalidad. Si la media y la desviacibn estandar 
muestral se emplean como parametros de la distribucion normal bajo la hipbtesis nula, 
la estadistica D„ tiene una distribucion cuyos cuantiles tambien obtuvo Lilliefors. De 
manera especifica, para a = 0.05 los valores del 95avo, percentil de la distribucion 
de esta estadistica bajo H 0 fueron los siguientes: 


n 

10 

12 

14 15 16 

18 

20 

25 

>25 

95avo. percentil 

0.258 

0.242 

0.227 0.220 0.213 

0.200 

0.190 

0.173 

0.886/Vn 


Empleese la modification de Lilliefors a la estadistica de Kolmogorov-Smirnov para 
probar la normalidad de los datos del ejercicio 1.2. Comparese el resultado con el del 
ejercicio 10.11. 

10.13. Usese el procedimiento de la prueba de bondad de ajuste chi-cuadrada para probar la 
hipbtesis nula de que los datos del ejercicio 1.2 se encuentran distribuidos, normalmen¬ 
te, a un nivel de a = 0.01. 

10.14. Se toma una muestra aleatoria de 25 hombres casados y se les pregunta la edad que 
tenian cuando secasaron. Se obtienen los siguientes datos: 24, 19, 20, 22, 50, 23, 23, 


'On llie Kolmogorov-Smirnov lest for normality with mean and variance unknown. J. Airier. Statistical 
Assoc. 64 (l%7). 399-402. 1967. 
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21, 25, 27, 45, 27,26, 26, 35, 29, 28, 30, 31,32, 31, 33, 34, 38, 41. Usese la estadlstica 
de Kolmogorov-Smimov para probar la hipbtesis nula de que la distribution de las 
edades de los hombres cuando contrajeron sus primeras nupcias es una distribution 
gamacon 6 = 2 y a = 16. Usese a = 0.05. (Sugerencia: Para calcular las probabili- 
dades gama, vease una tabla de la funciOn gama incompleta determinada por (5.55).) 

10.15. En el ejemplo 4.10, usese la prueba de bondad de ajuste chi-cuadrada para demostrar 
que la hipOtesis nula de una distribution binomial negativa para el numero de anota- 
ciones de seis puntos, no puede ser rechazada a un nivel a = 0.05. 

10.16. Con la prueba de bondad de ajuste chi-cuadrada determinese si la hipOtesis nula de los 
datos del accidente del ejercicio 8.14 sigue una distribuciOn binomial negativa, que se 
puede remitir al nivel a = 0.05 

10.17. Los totales de los renglones y columnas de una tabla de contingencia de dos caracteris- 
ticas son los siguientes: 


Bajo la hipOtesis nula de independencia, determinar la tabla de frecuencias esperadas. 

10.18. Un proceso de producciOn emplea cinco maquinas en sus tres operaciones de desplaza- 
miento. Se clasificO una muestra aleatoria de 164 fallas de acuerdo con la maquina y la 
operation de desplazamiento en la que ocurriO la falla, y los resultados se muestran en 
la tabla 10.6. Con base en esta information, ^existe alguna razon para dudar acerca 
de la independencia entre la operaciOn de desplazamiento y la falla de la m&quina? 
Usese a = 0.01. 

TABLA 10.6 Fallas por maquina y desplazamiento 

Maquinas 

Desplazamiento A, B C D E 

1 10 12 8 14 8 

2 15 8 13 8 II 

3 12 9 14 12 10 

10.19. Se condujo una encuesta aleatoria entre los ciudadanos en edad de votar para determi¬ 
nar si existia alguna relation entre la afiliaciOn partidista y la opinion con respecto al 
control de armas. Se obtuvo la informaciOn proporcionada en la tabla 10.7. Para a = 
0.01, iexiste alguna razOn para creer que existe una dependencia entre la opinion y la 
afiliaciOn partidista? 

TABLA 10.7 FiliaciOn partidaria y opiniones sobre el control de armas 



A favor 

En contra 

Sin decision 

, Democratas 

110 

64 

26 

Republicanos 

90 

116 

14 

lndependientes 

55 

35 

10 
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10.20. En una muestra aleatoria de recien egresados de la preparatoria se registraron dos ca- 
racteristicas (la califlcacidn promedio y el numero de respuestas correctas para la 
prueba SAT). Esta informacifln se clasificd como se muestra en la tabla 10.8 

TABLA 10.8 Calificaciones promedio y numero de 
respuestas correctas para laprueba SAT 

Numero de respuestas correctas para la prueba S/1 T 


GPA 

900-1100 

1100-1300 

1300-1500 

>3.5 

50 

65 

38 

3.0-3.5 

78 

72 

42 

2.5-3.0 

97 

80 

25 

2 .0-2.5 

105 

25 

18 


a) iExiste una dependencia entre el numero de respuestas correctas en la prueba SAT 
y el promedio de clasificaciones. discernible estadisticamente a un nivel a = 0.01 ? 

b) iSe tiene alguna reserva con respecto a esta clasificacidn? j,Se puede pensar en otras 
caracteristicas que deban considerarse? 

10.21. En un estudio reciente que involucro una muestra aleatoria de 300 accidentes automo- 
vilisticos, se clasificb la informacion de acuerdo con el tamaflo del automovil. 



Pequeno 

Mediano 

Grande 

Por lo menos 
un muerto 

42 

35 

20 

Ningun muerto 

78 

65 

60 


Con estos datos, ^depende la frecuencia de accidentes del tamaflo del automovil? Use- 
se a — 0.05. 


10.22. Se llevo a cabo una encuesta con respecto a la preferencia del consumidor para deter- 
minar si existia alguna predilection para tres marcas competitivas (A, B y C) depen- 
diendo de la region geografica en la que habita el consumidor. Con base en una 
muestra aleatoria de consumidores, se obtuvo la siguiente informacion para tres distin- 
tas regiones. 



Region 1 

Region 2 

Region 3 

Marca A 

40 

52 

25 

Marca B 

52 

70 

35 

Marca C 

68 

78 

60 


Con base en esta informacion, £la preferencia por una determinada marca depende de 
la region geografica a un nivel a = 0.05? 
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CAPlTULO ONCE 


Metodos para el control de calidad 
y muestreo para aceptacion 


11.1 Introduccion 

En los ultimos aflos ha aumentado el interes que se tiene, por parte de los producto- 
res asi como de los consumidores, en la calidad de los productos manufacturados. 
Un fabricante que desea mantener cierto nivel de calidad en su producto terminado 
debe implantar un procedimiento para detectar cualquier desviacion seria del est&n- 
dar de calidad deseado. En el logro de este fin, las tablas estadisticas de control de 
calidad y el muestreo peribdico han demostrado ser medios muy efectivos para 
controlar la calidad de los productos manufacturados. 

Por otro lado, el consumidor desea asegurarse de que el producto que adquiere 
reune ciertos estandares de calidad. Lo anterior es especialmente cierto si el consu¬ 
midor, como muchas veces ocurre en la practica, compra lotes muy grandes de cierto 
producto. En estos casos es necesario establecer un procedimiento para inspeccionar 
una muestra relativamente pequefla del producto proveniente del lote para decidir si 
reune los estandares de calidad deseados. Un procedimiento de esta naturaleza inclu- 
ye la notion del muestreo para aceptacion. 

En este capitulo se anaiizaran los principios basicos y metodos de las tablas de 
control estadistico y los procedimientos del muestreo para aceptacion. El lector debe 
considerar el material de este capitulo solo como introduccion al control estadistico 
de calidad y a los procedimientos del muestreo para aceptacion, pero este debe ser 
util como antecedente para un estudio posterior. Con este proposito se sugieren las 
referencias [2] y [3], 


11.2 Tablas de control estadistico 

Una tabla de control estadistico es un procedimiento inferencial basado en un 
muestreo repetitivo para estudiar un proceso. De acuerdo con su creador, W.A. 
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Shewhart, una tabla de control se emplea para definir un est&ndar de calidad para 
un proceso de fabricacibn y para determinar si este se mantiene por el proceso. 

En el desarrollo de tablas de control, el factor clave es la variabilidad en la calidad 
del producto terminado. Para cualquier proceso, es inherente cierta cantidad de va¬ 
riabilidad en la calidad, sin importar cu&ntos esfuerzos se encaminen para lograr su 
control. Este tipo de variabilidad es una funtibn de factores aleatorios que, de ma- 
nera comun, se encuentran mas alia del control. Esta variacibn aleatoria general- 
mente es aceptable y no compromete en modo alguno el est&ndar de calidad desea- 
do. La variabilidad tambien se puede deber a causas no aleatorias o fijas; estas 
pueden tomar la forma de un mal funcionamiento en una maquina, indiferencia del 
trabajador, variabilidad en la calidad de las materias primas y otras. De esta forma, 
una tabla de control estadistico es el procedimiento inferencial con el cual se decide 
si una desviacion observada de la norma deseada se debe solo al azar o a alguna 
causa fija. Si la decisibn es que la variation es aleatoria, entonces se dice que el proce¬ 
so de interes se encuentra bajo control. De otiu n.odo, se juzga como fuera de 
control y en este caso lo que se hace, en forma general, es detener el proceso y llevar 
a.C|feo todos Jos esfuerzos necesarios para detectar la causa del problema. 

Dado que la inferencia se basa en la probabilidad, es posible que un proceso se 
juzgue fuera de control cuando, de hecho, se encuentra bajo control o viceversa. Las 
consecuencias de estos errores pueden ser severas; por ejemplo si se declara a un 
proceso como fuera de control, cuando en realidad esta bajo control, se tratara de 
determinar una causa inexistente. Por otro lado, si el proceso en realidad esta fuera 
de control y se permite que este continue, el estandar de calidad deseado no se alcan- 
zara. Debe notarse que estos errores son facsimiles de los errores de tipo I y II anali- 
zados en el capitulo 9. 

£ Usualmente, la determination de una tabla de control depende de la toma pe- 
pbdica de muestras aleatorias de tamaflo n del proceso de interes, con lo que se ob- 
tiene; para cada una de estas, un valor de alguna estadistica de importancia como la 
media o la varianza muestral. Por lo tanto, la tabla de control es una grafica de los 
valores de la estadistica observada, contra el numero de la muestra o contra el pe- 
riodo durante el cual se obtuvo esta. La tabla contiene limites de control superior e 
inferior, los cuales constituyen los criterios de decision para el proceso, es decir, el 
proceso sera juzgado como bajo control mientras los valores de la estadistica se en- 
cuentren dentro de estos limites. Si un valor de la estadistica se encuentra fuera de los 
limites de control, se considerara al proceso como fuera de control. Tambien se en¬ 
cuentra una linea central que define la norma prescrita para el proceso. 

El usu&rio decide cuales deben ser los valores de los limites de control, cuantas veces 
(^sjjecesario muestrear, cual debe ser el tamano de la muestra que se toma y que action 
Tsalizar una vez que se juzga al proceso como fuera de control. Sin embargo, existen 
algunos principios generales que el usuario puede seguir. Shewhart argumentaba que 
podia alcanzarse un balance apropiado entre el costo del muestreo y la exactitud del 
estimador, si las muestras tienen un tamano de cuatro o cinco observaciones cada 
vez. Tambien los limites de control “tres-sigma” han demostrado ser muy satisfac- 
torios y son los que se emplean en Estados Unidos, asi como en muchos otros paises. 

Considerense las tablas de control para la media y la desviacion estandar. La pri- 
mera se conoce como tabla A" y la segunda como tabla S. Debe notarse que, de ma- 

www. FreeLibros. com 



11.2 Tablas de control estadlstico 381 


nera traditional, se empleael rango R para determinar tablas para la variabilidad de 
un proceso debido a su dilculo f&cil. Pero es mejor la tabla S, la cual no ofrece nin- 
gun problema de dilculo con los paquetes para computadora disponibles en la ac- 
tualidad. Para la determination de las tablas JC y S se supondri que se muestrea una 
distribution normal; en un caso, se darti por hecho que se conoce el valor de la me¬ 
dia o el de la varianza y, para el otro, que ambos valores son desconotidos. 

11.2.1 Tablas X (media conocida de la poblacibn) 

Se puede construir una tabla de control con base en la media muestral cuando la me- 
dicibn de interes se encuentra normalmente distribuida con media /j- y desviacibn es¬ 
tandar o o- conocidas. El conocimiento que se tiene sobre /x y <r se puede deber a la 
naturaleza particular del proceso de interes, el cual puede proporcionar la suficiente 
inforrnacibn con respecto a la media y a la desviacibn estandar. Para este caso, una 
tabla X proporciona el procedimiento inferencial por medio del cual se puede deci- 
dir si la media del proceso es la que se afirma. 

Sea A",, X 2 , .... X n una muesta aleatoria de tamaflo n del proceso de interes. 
Dado que por hipbtesis X, ~ /V(/x,a), la media muestral es X ~ N(p,o-/\Jri), la 
probabilidad de que lA' - /x| sea menor que 3 a/^/n, es 

P(\X ~ fi\< 3 tr/y/n) = 0.9974. 

De esta forma, los limites de control tres-sigma son /jl ± la/y/n, es decir, cuando 
se toma una muestra de tamaflo n se calcula y se grafica un valor de la media 
muestral. Si este se encuentra dentro de los limites de control /a. ± itr/y/n, se supone 
que el proceso se encuentra bajo control; de otra forma, esta fuera de control. Por lo 
tanto, cada vez que se toma una muestra se esta probando la hipbtesis nula de que la 
media del proceso es igual a /a. contra la alternativa de que ha ocurrido un corrimien- 
to en la media del proceso. El rechazo de la hipbtesis nula implica que el proceso se 
encuentra fuera de control. 

Ejemplo 11.1 En un proceso de llenado se tiene una maquina que vacia una canti- 
dad promedio de 500 g en cada recipiente, con una desviacibn estandar de 2 g. Se to¬ 
man 10 muestras diarias, cada una de cinco recipientes, y se mide el peso de cada re¬ 
cipiente. Los pesos promedio para las 10 muestras en una semana dada son los si- 
guientes: 


Numero de muestra 

i 

2 

3 

4 

5 

Promedio de la muestra 

498.37 

499.49 

501.25 

498.63 

502.97 

Numero de tnuesira 

6 

7 

8 

9 

10 

Promedio de la muesli a 

500.56 

499.23 

498.76 

501.05 

500.27 


Para los limites de control 3cr, ise encontro el proceso bajo control durante esta se¬ 
mana? Con estos limites, ^cual es la probabilidad de no detectar un corrimiento de 
500 a 503 g en la media? _ . .. 
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Dado que n = 5, p = 500, y cr = 2, Ios (unites de control 3 cr son 500 ±3(2/\/5) = 
500 - 2.6833 0(497.3167, 502.5833). Enla figura 11.1 se muestra la tabla de control 
para las medias muestrales. N6tese que la quinta media muestral se encuentra por 
encima del limite superior de control; de esta forma, durante este tiempo el proceso 
se juzg6 como fuera^de control en relacidn con el promedio. La probabilidad de ob- 
servar un valor de X fuera de los limites de control, si el proceso se encuentra real- 
mente bajo control, es 


P(\X - 500 | >2.6833) = 0.0026. 

La probabilidad de no detectar un corrimiento de 500 a 503 gramos en la media es 


m97.3167 < X < 502.6833 | p. = 503) = P 


497.3167 - 503 


<Z< 


2/V5 

= P( -6.35 < Z < -0.35) 
= 0.3632. 


502.6833 - 503 
2/V5 



1 2345678 9 10 

Numero de la muestra 


FIGURA 11.1 Tabla X para los datos del ejemplo 11.1 
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11.2.2 Tablas S (desviacibn est&ndar conocida de la poblacibn) 

En muchas ocasiones la variabilidad de un proceso es, por lo menos, tan importante 
como la media de este; por ejemplo, en la fabricacibn de instrumentos de precisibn, 
mantener la variacibn en las mediciones a un nivel aceptable es, probablemente, tan 
importante como el promedio. 

Se considerarbn las tablas de control para' |a variabilidad de un proceso mediante 
el empleo de la desviacibn estbndar de la muestra 



2(* f - X) 2 /(n - 1) 


1/2 


Los limites de control 3cr son E(S) ± 3 d.e.(S). Para obtener E(S) y Var(S), recuerde- 
se de la seccibn 7.5 que la variable aleatoria 


(n - 1)S 2 
cr 2 


tiene una distribucibn chi-cuadrada con n - 1 grados de libertad, en donde la fun- 
cibn de densidad de probabilidad de Y estb dada por (7.16). Dado que 


entonces 


Pero 


en donde 


S 2 = 


S = 


g- 2 Y 
n - r 

ctY 1/2 

(n - l)' /2 ' 


E(S) = 


cr 


;E(Y' /2 ). 


(n - 1) ,/2 ' 

E(Y' n ) = c| y l/2 y n_3,/2 exp(-y/2)dy, 
Jo 

1 


( 11 . 1 ) 


r[(« - i)/2] 2'” -1 ’ 72 ' 

En (11.1) sea u = y/ 2; entonces dy = 2du y 

i E(Y' /2 ) = 2" /2 c f u in - 2)/2 e\p(-u)du = 2 n/2 cV(n/2). 
J 0 


Entonces 


£ ' (5 > = 7- 2 " /2 t' r («/ 2) 

(n - 1) 

2 l/2 r>/2) 

- a (n - l) l/2 n(/i - U/2] 
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Es preferible utilizar una notacibn para el cpntrol .de calidad y escribir 

w ;i. r " ' £(5) c 4 cr, - -■ 

en donde ' w ' ■' j ;;i iv> 

Vs ' 2' /2 r(n/2) ' 

" (n - l) ,/2 r[(/i - l)/2] 

Para la varianza de S, por definicibn 

Var(5) = E(S 2 ) - E 2 (S). 

Pero en la seccibn 7.5 se demostro que E{S 2 ) = cr 2 , en consecuencia 
Var(S) = a 2 — C4O- 2 = cr'(l - cj), 
o en la notacibn preferible, 

Var(S) = cjtr 2 . 

Por lo tanto, d.e.{S) = c s a, y los limites de control 3cr son 


(11.3) 


c 4 cr ± 3c,cr, (11.4) 

en donde c 4 est4 dada por (11.3) y c, = (1 - c j ) ,/2 . Notese que, dado que se supone 
que el valor de cr se conoce, los limites de control solo son funciones del tamaflo de 
cada muestra. En la tabla 11.1 se determinan los valores de c 4 y c 5 para distintos va- 
lores usuales del tamaflo n de las muestras. 

Como ilustracibn, si cr = 2, los limites de control 3cr para la desviacion estan- 
dar muestral, con base en n = 5, son (0.94)(2) ± (3)(0.3412)(2) o (0, 3.9272). Para 
este ejemplo, en la tabla S el limite inferior de control es cero, la linea central se en- 
cuentra en 1.88 y el limite superior de control es 3.9272. Para n = 5 y cr = 2, la va- 
riabilidad del proceso se considera bajo control, siempre que el valor de la desviacion 
estandar muestral se encuentre dentro de los limites de control ya establecidos. 

11.2.3 Tablas X y S (media y varianza desconocidas de la poblacion) 

Se consideraran las tablas de control para aquellos casos en los que la distribucibn de 
la poblacion es normal, pero no se conocen los valores de la media y la desviacion es¬ 
tandar. Para esta situacion, los limites de control se basan en los valores estimados 
para p. y a. 

Dado que no se conoce el valor promedio del proceso, tampoco se conoce la linea 
central de la tabla de control. Si la linea central es un valor estimado basado en un 
gran numero de muestras, los limites de control que se obtienen de esta manera de- 


TABLA 11.1 Valores de c 4 y c 5 para tamanos n normales de la muestra 


n 

4 

5 

6 

7 

8 

9 

10 

Cj 

0.9213 

0.9400 

0.9315 

0.9594 

0.9650 

0.9693 

0.9727 

<•5 

0.3889 

0.3412 

0.3076 

0.2820 

0.2622 

0.2459 

0.2321 
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ben considerarse s61o como limites tentativos, ya que quiz& se necesite una modified 
ci6n antes de que se puedan utilizar para medir la calidad de un producto en futuras 
operaciones de productibn. Lo anterior signiflca que los limites de control tentativos 
son apropiados para determinar si las operaciones pasadas de un proceso de produc- 
ci6n estuvieron bajo control. Para extenderlos a la produccibn futura, el procedi- 
miento usual es eliminar todos aquellos puntos que se encuentren fuera de los limites 
tentativos de control y recalcular el valor de festos con base en el resto de la informa- 
cibn muestral. Se continua este proceso hasta que todos los puntos se encuentren 
dentrode los limites de control, tanto para la tabla X como para S. La razon para este proce- 
dimiento es que los limites de control para la futura production deben ser funciones de las ob- 
servaciones que se recabaron mientras el proceso de production estaba bajo control. 

De acuerdo con Shewhart, los limites tentativos de control deben estar basados, 
por lo menos, en 20 muestras, cada una con cuatro o cinco observaciones. Shewhart 
denominb a estas muestras subgrupos rationales, fistos deben seleccionarse de ma- 
nera tal que cada subgrupo sea practicamente homogeneo y proporcione la maxima 
oportunidad de variation de un subgrupo a otro. Para un proceso de production 
esto 'mplica que las observaciones para un subgrupo deben tomarse en un momento 
que sea diferente al de otro subgrupo. Se emplea un tamaflo relativamente pequefto 
de la muestra de cuatro o cinco observaciones, no s61o para mantener el balance 
entre el costo del muestred y la exactitud del estimado, sino tambien para dar una 
minima oportunidad de variation dentro de cada subgrupo. 

Sea m el numero de muestras y supongase que n, = n para toda i — 1, 2, ..., m. 
Ademas, sean X t y 5, la media y desviacion muestral de la i-esima muestra. Para to- 
das las m muestras, definanse las estadisticas. 

^ = (11.5) 

m i -1 

y 

i m 

S = ~2S,. ( 11 . 6 ) 

«i-1 

Es evidente que E(X) = /j.; de esta forma, el promedio de todas las m muestras en un 
estimador no sesgado de p. De manera similar, 

E(S) = — 2 E(Si) = — ( mc 4 a ) = c 4 ct, 
m m 

lo cual sugiere que un estimador decres S/c 4 . Los limites tentativos 3crpara la media 
muestral cuando no se conocen los valores de /x y <x son 

X±3-^= t (11.7) 

c 4 V« 


y los correspondientes a la desviacion estandar de muestra son 


5 ± 3 —. 

t'4 


en donde los valores de < 


com 


( 11 . 8 ) 
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Ejemplo 11.2 Los datos en la tabla 11.2 son 20 muestras, cada una con cinco ob- 
servaciones tomadas en intervalos de dos horas, de la resistencia a la tensidn en 
libras de un hilo. Para cada muestra se proporcionan los valores de la media y la des- 
viacidn est&ndar. Construyanse las tablas de control X y S con base en estos datos. 


Al promediar las 20 medias muestrales se obtiene x = 47.12, y si.se promedian 
las desviaciones estandar muestrales, se tiene s = 2.326. Para n = 5, c 4 = 0.94 
y c 5 = 0.3412. Entonces, por (11.7) y (11.8), los limites tentativos de control 3crpara 
las medias muestrales son 


47.12 


(3X2.326) 

(0.94)V5 


(43.80, 50.44), 


y los limites para las desviaciones estdndar muestrales son 


2.326 


(3K0.3412X2.326) . 
0.94 


En la figura 11.2 se proporcionan las tablas de control. N6tese que la variabili- 
dad del proceso parece estar bajo control, pero la media muestral para la vigesima 
muestra se encuentra fuera de los limites tentativos. Debido a lo anterior, se ob- 
tienen nuevos valores para los limites despues de omitir esta muestra. Estos son 


47.31 


(3X2.368) 

(0.94)\/5 


(43.93, 50.69) 


TABLA 11.2 Datos de la muestra de la resistencia a la tension de un hilo en libras 


Numero de 
la muestra 



Valores de la muestra 


X 

S 

1 

44 

46 

48 

52 

49 

47.8 

3.03 

2 

44 

47 

49 

46 

44 

46.0 

2.12 

3 

47 

49 

47 

43 

44 

46.0 

2.45 

4 

45 

47 

51 

46 

48 

47.4 

2.30 

5 

44 

41 

50 

46 

50 

46.2 

3.90 

6 

49 

46 

45 

46 

49 

47.0 

1.87 

7 

47 

48 

50 

46 

47 

47.6 

1.52 

8 

49 

46 

51 

48 

46 

48.0 

2.12 

9 

47 

42 

48 

44 

46 

45.4 

2.41 

10 

46 

48 

45 

51 

50 

48.0 

2.55 

11 

45 

47 

51 

48 

46 

47.4 

2.30 

12 

52 

51 

48 

48 

45 

48.8 

2.77 

13 

45 

45 

47 

49 

44 

46.0 

2.00 

14 

46 

47 

43 

48 

45 

45.8 

1.92 

15 

48 

49 

52 

46 

51 

49.2 

2.39 

16 

44 

46 

45 

47 

52 

46.8 

3.11 

17 

48 

50 

47 

46 

49 

48.0 

1.58 

18 

48 

52 

51 

47 

46 

48.8 

2.59 

19 

47 

51 

50 

46 

49 

48.6 

2.07 

20 

44 

43 

42 

43 

46 

43.6 

1.52 
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FIGURA 11.2 Tablas X y S para los datos del ejemplo 11.2 


para X y los limites 


2.368 


(3X0.3412X2.368) 

-—- = (0 4.9466) 


para S. Se observa que todos los puntos se encuentran dentro de los nuevos limites 
tentativos, tanto en la tabla X, como en la S. 

La construccion de las tablas X y S se basa en la distribucion normal. La tabla X 
es, relativamente, insensible a la hipotesis de normalidad debido al teorema del limite 
central. Sin embargo, la tabla S es mucho mas sensible a la hipdtesis de normalidad. 

Vale la pena mencionar la existencia de la tabla p. La tabla p puede construirse 
cuando se supone que el muestreo se lleva a cabo sobre una distribucion binomial 
con parametro de proporcion p. Los limites de control se obtienen para las propor- 
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ciones de muestra de unidades que caen en una de dos categories posibles. Para esta 
■situacion, lo que generalmente es de interes, es vigilar la proporcion de unidades de- 
fectuosas que produce un proceso de manufactura. 

Para construir los limites de control para las proporciones muestrales, supdngase 
que no se conoce el valor de p. Sea m el numero de muestras disponible, y A', el nume- 
ro de unidades defectuosas en la /'-esima muestra de tamaflo n. Entonces XJn.es un 
estimador de p basado en la /'-esima muestra, y P = (1 /mn) S"i, A - , es un estima- 
dor de p basado en todas las m muestras. De acuerdo con lo anterior, los limites ten- 
tativos 3 a para las proporciones muestrales XJn son 


P ± 3 P{] . ~ P) . (11.9) 

’ n 


11.3 Procedimienios del muestreo para aceptacion 

Un consumidor puede escoger uno de los tres caminos siguientes para verificar la ca¬ 
lidad de los articulos de un embarque que ha recibido: inspeccionar todos los 
articulos en el lote; inspeccionarlos en una muestra aleatoria proveniente del lote, o 
aceptar el lote sin llevar a cabo ninguna inspeccibn. La primera opcibn tiene general¬ 
mente un precio prohibitive y la ultima es poco probable que sea aceptada por un 
consumidor serio, con respecto a la calidad de los articulos que adquiere. Por lo 
tanto, la opcibn que tiene un balance adecuado entre el costo de la inspeccibn y el 
que implica aceptar un lote y usar articulos defectuosos, es la de inspeccionar los 
articulos en una muestra aleatoria proveniente del lote que se acaba de adquirir. Con 
base en el proceso de inspeccion, la decision usual es aceptar el lote, rechazarlo o to- 
mar otra muestra aleatoria. Si la decision de aceptar o rechazar se toma con base en 
los valores medidos de los articulos, con respecto a una medicion fisica continua, en¬ 
tonces se dice que la inspeccibn se lleva a cabo por variables. Si los articulos que se 
inspeccionan se clasifican como defectuosos o no defectuosos, y el lote se acepta o 
rechaza con base en el numero de articulos defectuosos en la muestra, se dice que la 
inspeccibn se lleva a cabo por caracteristicas. 

En esta seccibn se consideraran los fundamentos para desarrollar planes sencillos 
de muestreo con base en caracteristicas para decidir si se acepta o se rechaza un lote. 
Posteriormente se examinarb en forma breve el muestreo para aceptacion por va¬ 
riables. Sea N el tamaflo del lote. Entonces un plan basico de muestreo para acepta- 
cibn es seleccionar n articulos del lote de tamaflo N y aceptar el lote si el numero de 
articulos defectuosos en la muestra es menor o igual a un numero de aceptacion c, 
previamente estipulado. De otra forma, el lote se rechaza. Por ejemplo, un plan de 
muestreo puede definirse de la siguiente forma N = 10 000, n = 100. ye = I. 
Lo anterior significa que se seleccionaran, en forma aleatoria, 100 articulos de los 
10 000 que contiene el lote, y si se encuentra cuando mucho un articulo defectuoso, 
se aceptara el lote de N = 10 000 articulos. Si hay mas deun articulo defectuoso, el lote sera 
rechazado. El consumidor puede escoger entre regresar el lote rechazado al fabricante o so- 
meterlo a una inspeccibn del 100%. El primero constituye lo que se conoce como un procedi- 
miento de inspeccion no verificable, y el segundo como proceso de inspeccion verificable. 
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Sup6ngase que la informaci6n disponible para elconsumidor con respecto ai la 
calidad de los articulos en el lote, es la proporcibn promedio de articulos defectuosos 
que produce el proceso de manufactura que los fabrica. Uncriterio muy importante 
en un plan de muestreo es la probabilidad de aceptar el lote P(A), dada una propor¬ 
cibn de articulos defectuosos p. Bajo las hipbtesis adecuadas y para algun valor de p 
y de c, la probabilidad de que el lote sea aceptado con base en una muestra de tama¬ 
flo n, es la probabilidad binomial acumulativa 

P(A) = P{X « c) = £ (")/>'(« - PV~ J . 01.10) 

en donde la variable aleatoria X representa el numero de articulos defectuosos en- 
contrados en la muestra. Si np tiene un tamaflo moderado, la probabilidad binomial 
dada por (11.10) se puede aproximar en forma adecuada por la probabilidad acumu¬ 
lativa de Poisson 

P(A) = 2~^exp(-\), (11.11) 

j=0 x - 

en donde A = np. 

Una grafica de la probabilidad de aceptacibn contra p, es la curva de operacion 
caracteristica (CO). Como ilustracion se analizara el plan de muestreo n = 100 y c 
= 2. Mediante el empleo de la aproximacion de Poisson dada por (11.11) seobtiene 
la probabilidad de aceptar para valores de p en un intervalo de 0.01 a 0.09. Las proba- 
bilidades de aceptacion se dan en la tabla 11.3 y estan graficadas contra p en la figu- 
ra 11.3. 

La naturaleza de una curva CO es afectada por el tamaflQ n de la muestra y por el 
numero de aceptacibn c. Como ilustracibn, considerense los planes de muestreo 
n = 50, c = 1; n = 100, c = 2; y n - 200, e = 4. En la figura 11.4 se 
muestran las curvas CO para estos planes. Notese que aunque el cociente c a n es 
constante, las curvas CO son algo diferentes. De hecho, las curvas son mas sensibles 
al tamaflo de la muestra. Conforme n aumenta, la pendiente de la curva se torna m&s 
pronunciada. De esta forma, para tamaflos grandes de la muestra, la probabilidad de 
aceptacibn disminuye muy rapidamente conforme el valor de p aumenta. Si el valor 
de n es fijo, un aumento en el numero de aceptacibn c tendera a desplazar a la curva 
hacia la derecha. Esto implica que para una p dada, la probabilidad de aceptacibn es 
alta conforme c aumenta. En consecuencia, puede pensarse que entre mas cercano a 
cero se encuentre el valor de c, mejor es el plan de muestreo. Pero la figura 11.4 indi- 
ca que los planes con valores grandes de c son mejores siempre que el tamaflo de la 
muestra sea, apreciablemente, grande. 


TABLA 11.3 Probabilidades de aceptacion para el plan de muestreo n = 100, c = 2 


p 

0.01 

0.02 

0.03 

0.04 

0.05 

0.06 

0.07 

0.08 

0.09 

P(A) 

0.9197 

0.6767 

0.4232 

0.2381 

0.1247 

0.0620 

0.0296 

0.0138 

0.0062 
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FIGURA 11.3 Curva caractedstica de operacion para el plan de muestreo n = 100, c - 2 
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El desarrollo de buenos planes de muestreo incluye tanto al productor como al 
comprador del lote. De manera normal el productor es el vendedor y el consumidor 
el comprador. Un productor ciertamente desearia que el consumidor rechazara un 
porcentaje muy pequeflo de los lotes vendidos y que son, en general, buenos; el con¬ 
sumidor desearia aceptar un porcentaje muy pequeflo de los lotes que son malos. De 
esta forma los dos experimentan cierto riesgo. Supdngase que ambos estAn de acuer- 
do en que un lote es aceptable si la proporcidn de articulos defectuosos es p p, t y 
no aceptable si p s* p 2 . Se dan las siguientes defmiciones que implican riesgos. 

Definicidn 11.1 El riesgo del productor a es la probabilidad de que el consumidor 
rechace un lote cuya proportion de articulos defectuosos no es mayor que p r 

Definicifln 11.2 El riesgo del consumidor /3 es la probabilidad de aceptar un lote 
cuya proporcion de articulos defectuosos es mayor o igual a p 2 ■ 

Con base en estas definiciones, el riesgo del productor es la probabilidad del 
error de tipo I, dado que este representa la probabilidad de rechazar un lote acep¬ 
table. De manera similar, el riesgo del consumidor es la probabilidad del error de 
tipo II, ya que este representa la probabilidad de equivocarse al no rechazar un lote 
inaceptable. En otras palabras, la situacibn anterior es an&loga a probar la hipfltesis 
nula H 0 '- p = P i contra la altemativa H { : p = p 2 . 

Los riesgos del productor y del consumidor pueden representarse por dos puntos 
sobre una curva caracteristica de operacibn, como se ilustra en la figura 11.5. En 



FIGURA 11.5 Curva CO para los puntos de riesgo especificados para el productor y el con 
sumidor 
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este contexto, p x recibe el nombre de nivel aceptable de calidad (NAC), y p 2 el de to- 
lerancia de la proporcidn de defecluosos en el lote (TPDL). La pr&ctica usual ha sido 
la de escoger la probabilidad de aceptacibn P(A) - 1 - a en NAC cercano al punto 
0.95 de la curva, y la probabilidad de aceptacibn P(A) - p en TPDL cercano al 
punto 0.10 sobre la curva. Entonces, el 95 Vo de los lotes que provienen de un proce- 
so cuya prpporcibn de articulos defectuosos se encuentra en NAC, o por encima de 
este, se aceptar&, mientras que sblo el 10% de los que provienen de un proceso cuya 
proporcibn de articulos defectuosos se encuentra en TPDL o mas, sera aceptada. 

11.3.1 El desarrollo de planes de muestreo sencillos 

para riesgos estipulados del productor y del consumidor 

Se examinara un procedimiento para obtener planes de muestreo sencillos para valores 
especificados de los riesgos del productor y del consumidor. La esencia del procedi¬ 
miento esta en determinar el tamaflo de la muestra n y el numero de aceptacibn c, 
dadas las probabilidades de aceptacibn en el NAC y el TPDL. Por ejemplo, supbn- 
gase que se desea un plan sencillo de muestreo para el que la curva caracteristica de 
operacibn pasa a traves de un riesgo del productor a = 0.05 en un NAC de 0.01, y 
de un riesgo del consumidor p = 0.1 en un TPDL de 0.05. De esta forma, las pro¬ 
babilidades de aceptacibn al NAC = 0.01 y TPDL = 0.05 son 0.95 y 0.1, respectiva- 
mente. 

Supbngase que las condiciones son tales, que la distribucibn de Poisson propor- 
cionarci una aproximacion adecuada. Sea X la variable aleatoria que representa el 
numero de articulos defectuosos en una muestra de tamaflo n. Entonces para el ries¬ 
go del productor, se desea obtener n y c, tales que 

P(A) = f(Igc)= 2 X CXP | — = 1 - a, (11.12) 

v=o Jf! 

en donde X = np t . De manera similar, para el riesgo del consumidor, se desea ob¬ 
tener n y c, tales que 


x = n x - 

en donde ahora X = np 2 . Dado que se conocen los valores de a, P,p x y p 2 , el procesa- 
miento se reduce a la solucion simultanea de (11.12) y (11.13) para n y c. No existe 
ningun metodo directo para resolver estas dos ecuaciones; en otras palabras, es vir- 
tualmente imposible determinar un plan de muestreo cuya curva CO pasa en forma 
exacta a traves de dos puntos (/>,. 1 - a) y (p 2 , /3) debido a que los valores de n y 
c deben ser numeros enteros. Lo que se hace en forma general, es obtener cuatro pla¬ 
nes, dos de los cuales tendran el valor dado de a pero diferiran muy poco para el va¬ 
lor de P- mientras que los otros dos tendran el valor de P dado, pero diferiran muy 
poco del valor de a. 

Dados a = 0.05, /3 = 0.1, pj = 0.01, y p 2 = 0.05, el procedimiento es el 
siguiente: sea X, = np i y X 2 = np 2 y formese el cociente de X 2 a X,.Para el ejem- 
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plo se observa que el valor de este es 5. En forma ideal, lo que se busca es obtener 
el valor de c cuando X 2 /\, es exactamente 5. Dado que no es probable tener este va¬ 
lor de manera precisa, lo que se desea es determinar los dos valores de c que se en- 
cuentran relacionados con el valor de 5. Los anterior puede lograrse si se inicia con 
c = 0 y se interpola, para encontrar valores X,, tales que P(A) = 1 - a, y para 
Xj, tales que /’(A) = (3, mediante el empleo de la distribucibn acumulativa de Pois¬ 
son (tabla B del apendice). Entonces se aumenta el valor de c, y se continua el proce- 
so hasta que se encuentren los valores de c que esten relacionados con el cociente 
deseado. Los tamaflos correspondientes de las muestras se obtienen, primero, al fi- 
jar la probabilidad de aceptacion del riesgo del productor dado, y despues al hacer lo 
mismo para el riesgo del consumidor, este procedimiento darb como resultado cua- 
tro planes de muestreo diferentes. 

Dado que P(A) = 0.95 vc = 0, se obtiene que X, = 0.05. De manera similar, 
para P(A) = 0.1 y c = 0, X 2 tiene un valor de 2.30, y para el cociente X 2 /X, = 46. 
Ahora, para P{A) = 0.95 y c = 1, X, = 0.36, y para P(A) = 0.10, X 2 = 3.9. 
De esta forma X 2 /X| = 10.83. El proceso continua y se obtienen los resultados que 
se muestran en la tabla 11.4. Los dos valores de c que se relacionan con el cociente 
ideal de 5 son 2 y 3. 

Para obtener n, supdngase que se mantiene el riesgo del productor en a = 0.05. 
Entonces para c = 2, np, - 0.82;perop, = 0.01 yn = 82. Para el plan n - 82 
y c = 2, la probabilidad de aceptar a un nivel TPDL = 0.05 se obtiene mediante 
X 2 = (82)(0.05) = 4.1. De cuerdo con lo anterior P(A) = P(X =e 2) = 0.2238. 

Si se fija el riesgo del consumidor en/3 = 0.1, entonces para c = 2, np 2 = 5.32, 
y n = 107. Como resultado se tiene que X| = (107)(0.01) = 1.07, y la probabili¬ 
dad de aceptar en un NAC = 0.01 es P{A) = P(X 5 2) * 0.91. Se pueden es- 
tablecer los otros dos planes si se repite el proceso anterior con c = 3. En la tabla 
11.5 se resumen los cuatro planes; de estos, el que parece tener la menor importancia 
con respecto al riesgo especificado del consumidor es n = 82 y c = 2. Los otros tres, 
en especial los ultimos dos, se encuentran cercanos a los riesgos especificados, tanto 
del productor como del consumidor. La decision final sobre cual adoptar se toma 
con base en las circunstancias de la situacion. 

11.3.2 Muestreo para aceptaci6n por variables 

La mayoria de los planes de muestreo para aceptacion se llevan a cabo por caracte- 
risticas, debido a dos razones fundamentales: la inspeccibn por caracteristicas es 


TABLA 11.4 Determinacion de los valores de c que se encuentran relacionados con X : /\, - 5. 


Numero de 
aceptacidn c 

Valor de X, = up, 
para P(A) = 0.95 

Valor de X 2 = np. 
paraP(A) = 0.1 

A^/A| 

0 

0.05 

2.30 

46.00 

1 

0.36 

3.90 

10.83 

2 

0.82 

5.32 

6.49 

3 

1.37 

6.68 

4.88 
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TABLA 11.5 Cuatro planes de niuestro para a = 0.05, (3 = 0.1, NAC = 0.01, y TPDL = 
0.05. •> y .. : : 


«-w *l; , '... 

Plan de muestreo 

Probabilidad de aceptacidn 
para NAC = 0.01 

Probabilidad de aceptacidn 
para TPDL = 0.05' 

n = 82, c = 2 

, 0.95 

0.2238 

n = 107, c = 2 

0.91 

0.10 

n — 137, c = 3 

0.95 

0.09 

n = 134, e = 3 

0.95 

0.10 


muy econdmica y muchas de las caracterlsticas de calidad s61o son observables como 
atributos. Sin embargo, en algunos casos puede hacerse una medicion fisica de la ca¬ 
lidad de un producto dado. Cuando la aceptacidn se hace con base en mediciones 
fisicas se dice que el muestreo se lleva a cabo por variables. Cuando este es posible, 
se convierte en el tipo de muestreo mas popular, ya que una medicidn fisica es pro¬ 
bable que proporcione mucho mas information util con respecto a la calidad de un 
producto que la dada por caracteristica. Ademas, pueden obtenerse curvas CO m&s 
pronunciadas para el mismo tamaflo de la muestra. La inspection por variables en 
general es m&s costosa que la inspecciOn por caracteristicas, debido a que, principal- 
mente, tiene que aplicarse el criterio de aceptacidn por separado para cada mediciOn 
de calidad cuando se muestrea por variables. 

En el caso sentillo en el que la aceptacidn de un lote se hace con base en las me¬ 
diae de la muestra, se supone que la medicidn de la calidad es una variable aleatoria 
normalmente distribuida y con varianza conocida. Sean a el riesgo del productor y 
p a el promedio del lote para el que la probabilidad de aceptacidn es 1 - a. En for¬ 
ma similar, sea /3 el riesgo del consumidor y p e el promedio del lote para el cual la 
probabilidad de aceptacidn esj8.Es decir, si el lote tiene una media p a , se desea acep- 
tar el lote con una probabilidad 1 - a, y si este tiene una media p p (p a > se 
desea aceptar el lote con una probabilidad j3. Dados a, /3, p a , y /^, el plan de 
muestreo por variables es una muestra de tamaflo nyun valor_de aceptacidn x u , ta¬ 
les que, cuando el valor observado de la media de la muestra X es mayor que x,„ el 
lote ser& aceptado. 

Para obtener x„ y n, considerese lo siguiente. Para el riesgo del productor 

P(X^x„) = a 
o 

a, 

Za. (11-14) 
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en donde 


P [Z 


Ha 


r/\/n 


Xg ~ Ha 
a/y/n 





11.3 Procedimientos del muestrea para aceptaci&n -39S 


Para el riesgo del consumidor 

P(X > x„) = (3 


en donde 


i 



i't fs bis 15 ! 


( 1115 ) 


Las ecuaciones dadas por (11.14)y (11.15) dependen de las incognitas x„ y n. A1 re¬ 
solver (11.14) y (11.15) para se tiene 


_ cr 

X fl . Za /X a 

V« 

y 

cr 

■X t t f—Z\-(3 • 

yn 

A1 igualar (11.16) y (11.17) y resolver para /?, se tiene 

n = r «rfe,-, - Zj 2 
L Pp . 


( 11 . 16 ) 

(11.17) 


(11.18) 


Cuando se emplea (11.18) para obtener el tamaflo de la muestra, el valor de acepta- 
ci6n x„ se obtiene, ya sea de (11.16) o de (11.17). 

Ejemplo 11.3 La compaflia constructor de un gran edificio de oficinas se interesa 
en la resistencia a la compresibn del concreto que se emplear& en la construccibn del 
edificio. El proceso a traves del cual se fabrica el concreto con una resistencia pro- 
medio de 350 kilogramos por centimetro cuadrado es bueno. El concreto adquirido 
en este proceso debe aceptarse el 95% de las veces. Un proceso que ofrece una resis¬ 
tencia promedio de 347 kilogramos por centimetro cuadrado no es efectivo, y al ser 
adquirido ser& rechazado el 90% de las veces. Si el fabricante de cemento asegura a 
la compaflia que la desviacion est&ndar de su proceso no es mayor de 5 kilogramos 
por centimetro cuadrado, ^.cuantas muestras de concreto debe inspeccionar el 
contratista con respecto a su resistencia, y cual debe ser el valor de aceptacion para 
la media de la muestra bajo las condiciones dadas? Supongase que la resistencia a la 
compresion del concreto se encuentra normalmente distribuida. 


Los riesgos del productor y del consumidor estan dados como a = 0.05 para 
iu„ = 350 y /3 = 0.10 para fx a = 347, respectivamente. Para a = 0.05 y 
1 - /3 = 0.9, los valores cuantiles normales estandarizados correspondientes son 
= - 1.643 y z„ 9 = 1 .282. Entonces, mediante el empleo de(l 1.18), el tama- 
fio necesario de la muestra es 
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n = 


5(1.282 + l.645)l 2 
350 - 347 J _ ' 


Para el riesgo del productor (11.16) 

5 


" V24 

y para el del consumidor (11.17) 


!f„ = —= (- 1.645) -f- 350 = 348.32, 


x„ = —=(1.282) + 347 = 348.31. 


y/24 



Para x„ = 348.32, el plan de muestreo consiste en probar la resistencia de 24 
muestras de concreto provenientes del proceso v aceptar el concreto siempre que la 
resistencia promedio sea mayor de 348.32 kilogramos por centimetro cuadrado. 


11.3.3 Sistemas de planes de muestreo 

Desde la Segunda Guerra Mundial, los planes de muestreo para aceptacion se han 
convertido en procedimientos estandar para asegurar la calidad de los productos 
manufacturados y con este propbsito se ha desarrollado una gran variedad de siste¬ 
mas de planes de muestreo para aceptacibn. Tres de los sistemas m&s empleados son 
M1L-STD-105D*. M1L-STD-414, y el Dodge-Romig Sampling Inspection Tables. 
En las referencias [4], [5] y [1] se encuentra information detallada de estos sistemas. 
Los primeros dos fueron desarrollados por el Departamento de la Defensa y se apli- 
can bajo un procedimiento de inspeccibn no verificable. M1L-STD-105D contiene 
planes para el muestreo por caracteristicas y MIL- STD-414para el muestreo por va¬ 
riables. Los planes de muestreo Dodge-Romig se basan en un programa de inspec¬ 
cibn con verification; estos suponen un porcentaje de unidades defectuosas del proce¬ 
so conocido, y los planes de muestreo sencillos se encuentran indexados por TPDL 
para riesgo del consumidor de 0.10. Estos tres sistemas se encuentran descritos en [3]. 


Referencias 

1. H. F. Dodge and H. G. Romig. Sampling inspection tables — Single anti double 
sampling, 2nd ed. Wiley, New York. 1959. 

2. A. J. Duncan. Quality control and industrial statistics. 4th ed.. Richard D. Irwin, 
Homewood. III.. 1974. 

3. E. L. Grant and R. S. Leavenworth. Statistical quality control, 4th ed., McGraw-Hill. 
New York. 1972. 

4. Military standard I05D, Sampling procedures and tables for inspection by attributes. 
Superintendent of Documents, Government Printing Office. Washington. D.C.. 1963. 

* Fuera de Estados Unidos el sistema se conoce como ABC-STD-105D. 
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5. Military standard 414, Sampling procedures and tables for inspection by variables for 
percent defective, Superintendent of Documents, Government Printing Office, Wash¬ 
ington, D.C., 1957. 


Ejercicios 

11.1. El consejo estatal formado para controlar la calidad del agua selecciona cada semana 
cinco muestras de agua de una fuente de abastecimiento y determina la concentracion 
promedio de una sustancia toxica. Los siguientes datos son las cantidades promedio en 
partes por milldn durante 12 semanas. 


Semana 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

II 

12 

Media 

de la muestra 

5.2 

4.9 

5.5 

5.4 

4.8 

4.6 

5.5 

4.7 

5.1 

4.5 

5.8 

5.6 


a) Si los valores de la concentracibn promedio y de la desviacibn est&ndar son 5 y 0.5 
ppm, respectivamente, obtenganse los limites de control 3a para la concentracion 
promedio. Para este periodo, iexistio alguna razdn para alarmarse? 

b) Si se considera como peligrosa una concentracibn de 6 ppm, £que tan probable es 
tener un resultado como el anterior, con base en cinco muestras de agua, si la con¬ 
centracion real promedio es de 5 ppm? 

c) Mediante el uso de los limites de control de la parte a, £cual es la probabilidad de 
detectar un desplazamiento en el valor de la concentracibn media de 5 ppm a 5.25 
ppm? 

11.2. Mediante el empleo de la informacibn proporcionada en el ejercicio 11.1, obtenganse 
los limites de control 3a para la desviacibn estbndar de la muestra. 

11.3. Los siguientes datos son las tensiones de ruptura promedio de seis muestras de metal 
tomadas en forma periodica: 


Muestra 

1 2 3 

4 

5 

6 

7 

8 

9 

10 

Media 

de la muestra 

498.6 508.3 484.6 

505.7 

491.7 

495.4 

482.6 

515.2 

510.8 

503.7 


Se sabe que los valores de la tension de ruptura promedio y de la desviacibn estandar 
son 500 y 20 libras, respectivamente. 


a) Obtenganse los limites de control 3 ct para la tensibn de ruptura media de la muestra y 
hagase una grafica de la tabla de control. iExiste alguna media muestral que se en- 
cuentre fuera de los limites de control? 

b) Obtengase la probabilidad de no detectar un corrimiento en el valor real de la ten¬ 
sibn de ruptura promedio de 500 a 494 libras. 

c) Obtenganse los limites de control 3cr para la desviacibn estandar muestral. 

11.4. Los datos que se encuentran en la tabla 11.6 consisten en 20 muestras, cada una con 
cuatro observaciones, de los diametros de cojinetes producidos por un proceso de ma- 
nufactura. 

a) Construyanse los limites tentativos 3tr para las tablas de control X y 5. 

b) Si se detecta que el proceso no se encuentra bajo control, con base en alguna 
muestra, recalculense los limites tentativos. 
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TABLA 11.6 Datos de la muestra para el ejercicio 11.4 
Numero de 


la muestra Valores de la muestra (en eentimetros) 


1 

4.01 

4.03 

3.98 

4.04 

2 

3.97 

3.99 

3.99 

4.02 

3 

4.06 

4.05 

3.97 

4.02 

4 

3.96 

3.98 

4.07 

4.03 

5 

3.98 

3.99 

3.99 

4.00 

6 

4.01 

4.02 

3.% 

3.99 

7 

3.95 

3.98 

4.02 

4.03 

8 

4.03 

4.00 

3.% 

4.04 

9 

4.07 

3.96 

3.98 

4.05 

10 

3.98 

3.97 

4.02 

4.04 

II 

3.92 

4.03 

4.05 

3.99 

12 

3.97 

4.05 

4.04 

4.01 

13 

4.04 

4.04 

3.96 

3.99 

14 

4.03 

4.00 

4.02 

4.05 

15 

3.95 

3.% 

3.95 

4.02 

16 

4.05 

a.09 

4.07 

4.02 

17 

3.98 

4.06 

4.04 

4.03 

18 

4.01 

4.02 

4.00 

3.97 

19 

4.02 

4.01 

4.05 

3.99 

20 

3.99 

3.99 

4.01 

4.00 


11.5. Las tablas de control X y S de un proceso de llenado de recipientes se conservan por 
algun tiempo. Con base en 25 muestras periodicas, cada una con cinco recipientes, se 
obtieneque X = 400.2 g y S = 15.3 g. 

a) Si se supone que el proceso de llenado se encuentra bajo control icuales son los 
limites de control de la media y la desviacion estandar muestral? 

b) Obtengase un estimado de la desviacion estandar del proceso. 

11.6. En el ejercicio 11.5, supongase que cada muestra contenia seis recipientes. <,Como 
puede afectar este cambio a las respuestas de las partes ay bl 

11.7. En un proceso de manufactura, cada dia se seleccionan al azar 100 unidades y se envian 
para su inspeccion. Los siguientes datos son el numero de unidades defectuosas en la 
muestra durante 25 dias. 


Dia 

1 

2 3 

4 


5 

6 

7 

8 

9 

10 

n 

12 

13 

Numero de 














unidades 


1 4 

3 


2 

2 

5 

3 

4 

2 

i 

5 

2 

defectuosas 














Dia 

14 

15 16 


17 


18 

19 

20 

21 

22 

23 

24 

25 

Numero de 














unidades 

3 

2 1 


0 


6 

4 

5 

2 

i 

8 

3 

2 

defectuosas 















a) Con base en esta information, obtengase una tabla p. 

b) Revisense los limites de control si algun dia el proceso se juzgo como fuera de 
control. 
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c) Si se supone que el proceso se encuentra bajo control con un porcentaje de unidades 
defectuosas, igual al obtenido en la parte b, £cu&] es la probabilidad de que, en un 
dla determinado el proceso se considere como fuera de control? 

11.8. Se supone que el porcentaje de unidades defectuosas para un proceso de manufactura 
es de 4%. El proceso se vigila diariamente mediante la toma de muestras de n = 80 
unidades. £ste se detiene cada vez que se enCuentran cinco o mis unidades defectuosas 
en la muestra. Si el verdadero porcentaje de unidades defectuosas es de 5.5%, icual es 
la probabilidad de detener el proceso? 

11.9. Sup6ngase que la calidad de un lote muy grande es de s61o 5% de unidades defec¬ 
tuosas. Un plan de muestreo para aceptacidn requiere una muestra de 40 unidades y un 
numero de aceptacion igual a 2 unidades. 

a) iCuil es la probabilidad de que el lote sea aceptado? 

b) Si la calidad real del lote es de 6.25% de unidades defectuosas, £cuil es la probabili¬ 
dad .’c que el lote sea aceptado? 

11.10. Para el ejercicio 11 .9, supongase que el tamaflo de la muestra es de n = 80 unidades y 
el numero de aceptacion es igual a cuatro unidades. iComo afectaran estos cambios a 
las respuestas de las partes a y bl 

11.11. La calidad de un lote de N = 20 unidades es del 10% defectuosas. Si se toma una 
muestra aleatoria de cinco unidades y no se encuentra ninguna defectuosa se aceptara 
el lote. iCual es la probabilidad de aceptar el lote? 

11.12. Hagase una grafica de las curvas caracteristicas de operation para los planes de 
muestreo n = 25, c = 1 y n = 50, c = 2. Comparense las curvas caracteristicas de ope¬ 
racion. 

11.13. Para el plan de muestreo n = 25, c = 1, empleese la curva CO para obtener el TPDL 
para un riesgo del consumidor de 0.05. 

11.14. Para el plan de muestreo n = 50, c = 2, empleese la curva CO para obtener el NAC 
para un riesgo del productor de 0.05. 

11.15. Obtenganse los cuatro planes de muestreo que relacionaran los riesgos del productor y 
del consumidor de a = 0.05 para NAC = 0.02 y (3 = 0.1 para TPDL = 0.08, res- 
pectivamente. 

11.16. Obtenganse los cuatro planes de muestreo que relacionaran los riesgos del productor y 
del consumidor de a = 0.10 para NAC = 0.01 y (i = 0.1 para TPDL = 0.05. 

11.17. En muchas ocasiones se emplea un plan de muestreo doble para el muestreo de acepta¬ 
cion; este plan requiere una muestra aleatoria de n [ unidades de un lote de iV unidades. 
Si el numero de unidades defectuosas no es mayor que c ., el lote se acepta; si se 
encuentra una cantidad de unidades defectuosas ts > c, el lote se rechaza. Si el nume¬ 
ro de unidades defectuosas en la primera muestra es mayor que c ]( pero menor que c 2 , 
se toma otra muestra aleatoria de tarnano El lote se acepto si el numero de unida¬ 
des defectuosas en ambas muestras no es mayor que c,; de otra forma el lote se recha¬ 
za. Mediante el empleo de este procedimiento determinense las siguientes probabilidades 
para el doble plan de muestreo /V = 5000, n, = 50, ru = 80. c, = 0, c , = 3si la cali¬ 
dad del lote es de 2% de unidades defectuosas. 

a) La probabilidad de aceptar el lote con base en la primera muestra. 
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b) La probabilidad de rechazar el lote con base en la primera muestra. 

c) La probabilidad de aceptar el lote despues de tomar la segunda muestra. 

d) La probabilidad de rechazar el lote despues de tomar la segunda muestra. 

11.18. Una agencia estatal se encarga de vigilar el nivel de concentracibn de cierto contami- 
nante quimico, el cual ha sido derramado en grandes cantidades en uno de los rios mas 
grandes del estado. La agencia debe decidir en forma peribdica cuando el nivel de con¬ 
centracibn se encuentra entre limites seguros para permitir la pesca con fines comer- 
ciales. La agencia desea obtener un plan de muestreo por variables de tal manera que 
cuando el nivel de concentracibn promedio real sea de 5.6 ppm decidira el 95% de las 
veces que la pesca continue. Pero desea prohibir la pesca el 99% de las veces que se ob¬ 
serve una concentracibn hasta de 6.0 ppm. Si la desviacibn est&ndar no es mayor de 
una parte por millon, determinese el plan de muestreo. Supongase que la concentra- 
cibn de este contaminante se encuentra normalmente distribuida. 

11.19. Un comprador de grandes cantidades de hilo desea desarrollar un plan de muestreo por 
variables para la tension de ruptura del hilo. El hilo sera aceptado por el comprador si 
su tensibn de ruptura es mayor de 60 libras. Si se sabe que la desviacibn estandar del 
hilo es de 8 libras y dados a = 0.05, j3 = 0.05,NAC = 0.05yTPDL = O.l.obtenga- 
se el plan de muestreo. Supongase que la tensibn del hilo se encuentra normalmente 
distribuida. 
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CAPITULO DOCE 


Diseno y analisis 

\ ' 

de experimentos estadisticos 


12.1 Introduccion 

En las secciones 9.6.3 y 9.6.4 se introdujeron algunas ideas basicas con respecto a la 
planeacion y adquisicion de datos experimentales, con el proposito de alcanzar el 
maximo beneficio de la aplicacion de la inferencia estadistica. En este capitulo se es- 
tudiara la notion de experimentos diseflados estadisticamente y se extenderan algu- 
nos de los metodos del capitulo 9 mediante la introduccion de una tecnica estadistica 
importante conocida como an&lisis de varianza. 


12.2 Experimentos estadisticos 

Para cualquier fenomeno en el que existe la incertidumbre, el procedimiento apro- 
piado para investigarlo es experimentar con el, de manera que puedan identificarse 
las caracteristicas de interns. Por ejemplo, supongase que se desea identificar el com- 
portamiento optimo de un sistema con respecto a su funcionamiento y costo en dis- 
tintas condiciones; entonces debe pensarse en im experimento como medio para que 
el sistema sea observado bajo las condiciones de interes, de tal manera que su com- 
portamiento pueda conocerse. 

El elemento mas importante de un experimento, y que muchas veces se subestima, es 
la formulation del problema por resolver. No puede esperarse una oportunidad 
de exito razonable sin alguna direction con respecto al proposito del experimento. 
Una vez que este se define, es necesario identificar la variable por mediro respuesta 
que se va a estudiar y el factor o factores potenciales que pueden influenciar la va- 
riabilidad de la respuesta. La respuesta tambien se conoce como variabledependien- 
te; el factor recibe el nombre de variable independiente; se supone que este ultimo se 
encuentra bajo el control del investigador. Por ejemplo, en una tienda el interes re- 
cae en el numero de empleados disponible, de manera que el tiempo de espera del 
cliente no sea excesivo. En este caso, la respuesta es el tiempo de espera y el factor el 
numero de empleados disponible. 
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Un nivel o tratamiento del factor es un valor o condition de este bajo el cual se 
observara la respuesta medible. Por ejemplo, supongase que se desea observar el 
tiempo de espera cuando la tienda tiene a su servicio dos, cuatro o seis empleados a 
la vez. Si un experimento consiste en varios factores, un tratamiento es una combi¬ 
nation de los niveles de cada factor; por ejemplo, si se desea estudiar el tiempo de es¬ 
pera como una funcion del numero de empleados en un determinado momento del 
dia, entonces un tratamiento es la combination de un numero particular de emplea¬ 
dos en un momento dado del dia. El proceso por medio del cual se seleccionan los 
tratamientos se encuentra dictado mas o menos por las metas del experimento. Para 
experimentos preliminares, en los cuales el proposito primordial es aislar los princi- 
pales factores, el investigador debe escoger mentalmente los tratamientos con una 
vision muy amplia, de manera que obtenga un conocimiento util del mecanismo bajo 
estudio. En forma posterior, se puede conducir un experimento mas preciso con el 
propbsito de hacer hallazgos mas especificos. 

Una unidad experimental se define como el objeto (persona o ccsa) que es capaz 
de producir una medicion de la variable de respuesta despues de aplicar un tratamien¬ 
to dado. La selection de una unidad experimental o del tamafio de esta descansa, de 
nuevo, enteramente en el experimentador. Por ejemplo, si un fabricante de focos de¬ 
sea comparar la duration de estos con la de sus competidores, entonces los focos selec- 
cionados son las unidades experimentales y el numero de marcas diferentes los trata¬ 
mientos. O si se tiene interes en determinar la concentracion de un contaminante en 
un lago en funcion de la ubicacion geografica, entonces las localidades del lago que 
se seleccionan para medir la concentracion del contaminante son los tratamientos y 
la pequefia area superficial de cada localidad, la unidad experimental. 

En un ambiente de incertidumbre los experimentos son, en forma general, com- 
parativos en el sentido de que, idealmente, miden y comparan las respuestas de uni¬ 
dades experimentales esencialmente identicas, despues de que estas se exponen a los 
tratamientos seleccionados y aplicados por el investigador. Todos los factores exter- 
nos que pueden influenciar la respuesta deben eliminarse o controlarse. Sin embargo, 
no siempre puede garantizarse el control de los factores externos; por ejemplo, en 
forma practica, casi cualquier experimento que incluye alguna actividad financiera 
guardara alguna interrelation con las condiciones economicas prevalecientes que no 
pueden controlarse. Tal desviacidn del control experimental ideal necesita de la repe¬ 
tition del experimento en una muestra de unidades experimentales para determinar 
la variacion aleatoria o error experimental. Esta es la variacion extrafia en la res¬ 
puesta o la variacion que no puede ser atribuible a un cambio de tratamiento. Por lo 
tanto, es posible la inferencia estadistica al comparar el error experimental con las 
respuestas promedio que resultan de la aplicacion de los diferentes tratamientos. 

En algunas ciencias pueden llevarse a cabo experimentos de laboratorio ideales, 
pero en las ciencias socioeconomicas, las desviaciones de las condiciones experimenta¬ 
les ideales tienen un lugar comun debido a que el medio no permite un control sufi- 
ciente. Por ejemplo, puede ser interesante estudiar el efecto de un aumento en las tasas 
de interes (tramiento) en la actividad de construction de casas (respuesta) por parte de 
los constructores (unidades experimentales). Los tratamientos no pueden aplicarse a 
las unidades experimentales, ni la respuesta puede medirse de acuerdo con un experi¬ 
mento planeado. Solo puede registrarse la information conforme cambian las condi- 
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ciones en el mundo real. Aunque para un purista lo anterior no constituye un experi- 
mento, estos tipos de estudios merecen una considerable atencibn. Para el an&lisis de 
estos datos es mas apropiado el empleo de los metodos de regresibn que los que se es- 
tudiar^n en este capitulo. En los capltulos 13 y 14 se examinard el an&lisis de regresibn. 


12.3 Diseiios estadisticos 

El proceso por medio del cual se miden las observaciones de la respuesta se centra en 
un diseflo estadistico. En general, en los experimentos diseflados estadisticamente, las 
unidades experimentales deben seleccionarse en forma imparcial, asi como los trata- 
mientos asignados a estas, mediante un proceso aleatorio, con el propdsito de remo¬ 
ver los posibles sesgos sistemdticos. Como ya se indicd en el capitulo 9, el proceso 
aleatorio no solo protege contra el sesgo sistemdtico, sino tambien tiende a neutrali- 
zar los efectos de todos aquellos factores extemos que no se encuentren bajo d 
control del investigador. Entonces las comparaciones entre los tratamientos se mi¬ 
den, en forma practica, como si el efecto en la respuesta se debiera sdlo a la diferen- 
cia entre los tratamientos. 

En un experimento diseiiado estadisticamente es de igual importancia el concep- 
to de repetition , Como ya se ha notado con anterioridad, el proposito de la repeti- 
ci6n es medir el error experimental. La magnitud de este juega un papel muy impor- 
tante en la toma de decisiones con respecto a la posibilidad de que las diferencias 
entre los tratamientos sean discernibles en forma estadistica. 

En el diseflo de experimentos estadisticos, el interes primario recae en como asig- 
nar las unidades experimentales a los tratamientos (o viceversa), para asegurar un 
proceso imparcial. En este contexto surgen dos conceptos basicos: el proceso de 
asignacion debe hacerse con base en un diseflo completamente aleatorio, o en un di- 
seno en bloque completamente aleatorio. Cualquiera de estos dos diseflos puede 
emplearse en experimentos uni fact oriales o en aquellos en los que se desea investigar 
varios factores en forma simultanea. Con un diseflo complementario aleatorio, la 
asignacibn de los tratamientos a cada unidad experimental se lleva a cabo en forma 
totalmente aleatoria y todas las unidades se suponen homogeneas. En forma gene¬ 
ral, se hace uso de un procedimiento aleatorio sencillo como la generacibn de nume- 
ros aleatorios para llevar a cabo el proceso de asignacibn. El uso de un diseflo 
completamente aleatorio implica que las condiciones bajo las cuales sera observada 
la respuesta (u otras que se encuentren bajo el control del investigador) seran las mis- 
mas a traves de todo el experimento. Este tipo de diseflo no debe usarse en aquellas 
situaciones en las que las observaciones se realizaran sobre factores potenciales 
como el tiempo, el espacio o efectos demograficos, a menos que estos sean partes 
legitimas del experimento. 

No obstante, muchas veces el investigador se da cuenta de que el experimento no 
se puede conducir en el mismo ambiente, debido, principalmente, a que no todas las 
unidades experimentales son homogeneas; por lo tanto, estas se clasifican en bloques 
homogeneos y se asignan todos los tratamientos en forma aleatoria a las unidades de 
cada bloque, con lo que se crea lo que se conoce como un diseflo en bloques completamen¬ 
te aleatorio. La palabra “completamente” indica que cada bloque contiene todos los 
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tratamientos, mientras que la palabra “aleatorio” significa que todos los tratamientos 
ser&n asignados, en forma aleatoria, a las unidades experimentales de cada bloque. 

El investigador reconoce la necesidad de agrupar en bloques, mediante la identifi¬ 
cation de los elementos potenciales de las unidades experimentales que no se han 
incluido en la definition de un tratamiento, pero que pueden causar una variation 
significativa en la respuesta, Muchas veces estos guardan relation con efectos espa- 
ciales, temporales o demograficos. Por ejemplo, si las unidades experimentales son 
seres humanos, entonces el agrupamiento por bloques debera hacerse tomando en 
cuenta sexo, edad, condiciones de salud, experiencia, etc., como lo dicta el experi- 
mento. Si este se va a realizar en un lapso grande debera considerarse como una 
variable para el agrupamiento por bloques. Si los datos experimentales se van a reco- 
lectar, ya sea en distintas localidades o en grupos, entonces estos deberan conside¬ 
rarse como variables en bloque. Si se van a usar varios instrumentos para registrar 
los datos, se debera considerar un agrupamiento de instrumentos por bloques, aim si 
estos son del mismo modelo y con mayor razon si provienen de distintos fabricantes. 

Por lo tanto, la necesidad de agrupar en bloques es evidente; entre mas heteroge- 
neas son las unidades experimentales, mayor es el error experimental y menor la 
oportunidad de detectar diferencias reales entre los diversos tratamientos. La razon 
de agrupar en bloques es tomar en cuenta, y de esta forma remover, la fuente de va¬ 
riation en la respuesta que no es de interes, con lo que se incrementa la sensitividad 
para detectar diferencias entre los tratamientos. Asi, el principio general de un dise¬ 
no estadistico radica en minimizar el error experimental mediante el control de las 
variaciones extranas, de manera que pueda detectarse la variation sistematica en la 
respuesta. 


12.4 Analisis de experimentos unifactoriales en un diseno 
completamente aleatorio 

El tipo de experimento mas sencillo es aquel que com para el efecto de k 3= 2niveles de 
un solo factor sobre alguna variable de respuesta. Los niveles del factor son los tra¬ 
tamientos, y si estos se aplican en forma aleatoria a un conjunto virtualmente homo- 
geneo de unidades experimentales, el experimento tiene un diseflo completamente 
aleatorio. Esta situation es una extension natural del problema que surge cuando se 
comparan dos medias poblacionales en donde las variantes son desconocidas pero 
que se suponen iguales. La prueba t para dos muestras, la cual se estudio en el capi- 
tulo 9, se basa en un diseno completamente aleatorio. 

Para k 3= 2 niveles, se desea probar la hipotesis nula 

H 0 : Mi = M: = = P-k (12.1) 

contra la alternativa de que algunas de las medias de la poblacion no son las mismas. 
Si es posible rechazar la hipotesis nula con base en k muestras independientes, en¬ 
tonces las medias de las k poblaciones no son todas iguales entre si, o el efecto de los 
tratamientos sobre la respuesta es estadisticamente discernible. Si no puede recha- 
zarse la hipotesis nula, cualquier desviacion observada en la respuesta se debe solo al 
error aleatorio y no a causa de un cambio en el tratamiento. 
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Se pueden manejar muchos problemas practicos con un experimento unifactorial 
completamente aleatorio. Unos cuantos ejemplos son los siguientes: saber si tienen 
algun efecto sobre el consumo de energia ligeras diferencias en el aislamiento de los 
techos de las casas; si la media del llenado producido por maquinas en un proceso de 
llenado es la misma, o si los vendedores que reciben diferentes metodos de entrena- 
miento, incrementan su volumen de ventas en forma diferente. En estos casos, los 
tratamientos son el aislamiento de los techos, las diferehtes maquinas y los diversos 
metodos de entrenamiento; las unidades experimentales son las causas selecciona- 
das, los recipientes llenos y los vendedores, respectivamente. En el primer caso los 
tratamientos son cuantitativos, ya que los distingue una escala bien definida (R). En 
los ultimos dos casos los tratamientos son cualitativos, dado que representan cosas o 
sujetos diferentes y por lo tanto carecen de escalas numericas. 

La necesidad de tener unidades experimentales homogeneas esencialmente puede 
ilustrarse con el primer ejemplo. Si se seleccionan casas para el experimento que no 
sean del mismo tamaflo, en ese caso n^ se tiene el mismo aislamiento en los techos y 
se tienen dist : ntas calidadescon respecto al clima, si estas se localizan en distintas zo- 
nas geograficas; de esta forma las diferencias en el consumo de energia no se pueden 
atribuir solo al aislamiento del techo. Asi, para un diseflo completamente aleatorio los 
resultados seran ambiguos, a menos que las unidades experimentales sean virtual- 
mente homogeneas. 

La tecnica del analisis de varianza proporciona el procedimiento inferencial para 
probar la hipotesis nula dada por (12.1). Para desarrollar esta tfccnica, se analizara 
el problema del aislamiento. Supongase que se tiene interes en k diferentes niveles 
de aislamiento en el techo, tales que para el y-esimo nivel se observara el consumo de 
energia mensual del sistema de calentamiento en casas diferentes pero muy simila- 
res. Las casas que se seleccionan para este experimento son homogeneas y los factores 
extemos estan controlados dentro de ciertos limites practicos. La information de la 
muestra puede colocarse como se presenta en la tabla 12.1, donde la respuesta medible 
es el numero de kilowats-hora mensuales utilizados por el sistema de calentamiento 
de cada casa. 


TABLA 12.1 Arreglo comun de los datos de la muestra de un experimento con solo un factor 
completamente aleatorizado 


1 

2 

Tratamientos 

j 

k 

y» 

T,: 

Y\j 

Yu 

T 2 | 

Yu 

Yy 

y h 

y„ 

Yn. 

Y,j 

Y, k 

Y„„ 

Y„ a 

Y.j 

Y„u 
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Se supone que cada nivel de aislamiento termico en los techos representa una 
poblacion a partir de la cual se obtiene una muestra; tambien, que las distribuciones 
de las poblaciones para cada nivel de aislamiento son normales con varianzas 
iguales. De acuerdo con lo anterior, las columnas de la tabla 12.1 representan k 
muestras aleatorias independientes de tamaflos n h j= 1, 2, k. Si la hipbtesis nula 
dada por (12.1) es derta, la observacion Y it es el uso promedio de energia de los siste- 
mas de calentamiento para todos los k niveles de aislamiento termico y cualquier 
desviacion del promedio se debe a un error aleatorio. Si H 0 es falsa, entonces Y u esta 
constituida por todos los promedios, mas el efecto dely-esimo tratamiento y el error 
aleatorio. El promedio matem&tico para un experimento unifactorial completa- 
mente aleatorio es 


Yij M + Bjj j 1,2, ..., k, (12.2) 

i = 1,2, ..., rij , 

en donde Y tJ es la /-esima observacion del y'-esimo tratamiento, /* es la media sobre to- 
das las k poblaciones, r ; es el efecto sobre la respuesta debido aly-esimo tratamiento, y 
e, * es el error experimental para la /-esima observacion bajo ely-esimo tratamiento. 

Se supone que los errores son independientes y que se encuentran normalmente 
distribuidos con medias cero y varianzas iguales. En otras palabras, e, 7 ~ 7V(0, cr ) 
para toda / y y. La suposicion sobre los r/ depende de c6mo considere el investigador 
los niveles del factor. Si el investigador esta interesado en lo que le pasa a la respues¬ 
ta, solo para ciertos niveles del factor que se seleccionan de antemano, entonces 
T|, r 2 , ..., r k se consideran como parametros fijos tales, que 

* 

2 n/rj = 0. 

i -1 

Por lo tanto, el modelo dado por (12.2) se conoce como modelo de efectos fijos y las 
inferencias estadisticas con respecto a los efectos de los tratamientos pertenecen, en 
forma exclusiva, a los niveles seleccionados. 

Por otro lado, si los niveles empleados en el experimento se seleccionaron al 
azar, de una poblacion de posibles niveles, entonces r,, t 2 , ..., r k son variables 
aleatorias independientes que t, ~ N( 0, cr]) para toda y. En este caso, el modelo 
dado por (12.2) se conoce como modelo de efectos aleatorios, y las inferencias 
estadisticas con respecto a los niveles de un factor pertenecen a la poblacion de niveles. 

En general, para factores cuantitativos es deseable escoger niveles fijos del inter- 
valo de interes, debido a que no es probable que una seleccion aleatoria proporcione 
una amplia cobertura de este. La interpolacion de los niveles fijos previamente selec¬ 
cionados tambien es una practica muy segura para factores cuantitativos. Cuando 
los factores son cualitativos como seres humanos, localidades o grupos, su seleccion 
solo es importante cuando puede revelar algo con respecto a la variabilidad de la 
poblacion. 


*En lugar de emplear una letra mayuscula para las variables aleatorias e, v , se seguira la tradicion de utili- 
zar la letra griega minuscula epsilon. 
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Para un modelo de efectos fijos, una hipbtesis nula equivalente a (12.2) es 

H 0 :tj = Q, para today. (12.3) 

La hipotesis nula (12.3) establece que no existe ningun efecto de los tratamientos 
sobre la respuesta, lo que a su vez implica que las k medias de la poblacion son 
iguales entre si. Entonces se tiene como resultado que cada observacion consiste en 
una media comun y cualquier desviacion con respecto a esta se debe a la variation 
inherente dentro de cada poblacion. 

Para un modelo de efectos aleatorios, la hipotesis nula consiste en la proposition 
de que la varianza entre los r y (o los efectos del tratamiento) es cero; es decir, 

H 0 : crl = 0. (12.4) 

Asi, al suponer independencia entre los errores y tratamientos aleatorios, 

VariY,j) = a 2 + a 2 T . 

Para el modelo de efectos aleatorios, el interes recae en hacer una evaluation de 
cuanto de la varianza en las observaciones se debe a diferencias reales en las medias 
de los tratamientos y cuanto se debe a errores aleatorios con respecto a estas medias. 

En este capitulo el principal interes se centra en el modelo de efectos fijos, pero 
se incluira el caso de efectos aleatorios cuando sea necesario. El punto de vista 
empleado para desarrollar la tecnica del analisis de varianza sera, en gran parte, in- 
tuitivo. Para un tratamiento teorico de la materia, vease [6]. 


12.4.1 Analisis de varianza para un modelo de efectos fijos 

Sean p,, p 2 , ..., Pk las medias de las k poblaciones, y sea p la media de todas las 
poblaciones. Se define el efecto r, del y'-esimo tratamiento como la desviacibn de la 
y-esima poblacion media p, respecto a la media global p■ De esta forma, 

T i = My “ 7 = 1.2. k. 

En el mismo sentido, el error aleatorio correspondiente e, 7 de la observacion es la 
desviacion de Y 0 con respecto de la y-esima media Pj o 

e,j = Y u - Hj, i = 1.2. k, 

i = 1,2, .... rij. 

De acuerdo con lo anterior, el modelo dado por (12.2) puede escribirse de la siguien- 
te manera 


Yij = M + (My - M) + ( Y ,j - My), 
o 

Yij - M = (My - M) + (Y u - pj). 
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La igualdad dada por (12.5) establece, en forma expllcita, que cualquier des¬ 
viacion de una observation con respecto a la media global se debe a dos posibles 
causas: a la diferencia en el tratamiento oaun error aleatorio. Si se rechaza la hipo- 
tesis nula dada por (12.3), los datos de la muestra deben demostrar que la desviacibn 
total que se debe a la diferencia en el tratamiento es, suficientemente, mas grande 
que la desviacion causada por el error aleatorio. De esta forma, la tecnica del anali¬ 
sis de varianza es en realidad un analisis de la variation de las medias y este se logra 
mediante la participation de la variacion total en las observaciones en componentes 
especificados por el modelo matematico. Esto permite determinar una estadistica 
apropiada de tal manera que pueda tomarse una decision con respecto a la hipotesis 
//»: fj ~ 0 

Los parametros /x ,, p,, ..., p k y pno son conocidos, pero pueden estimarse con 
base en las observaciones de las k muestras aleatorias. Para la information de la 
muestra dada en la tabla 12.1 se define lo siguiente: 


Tj - 2 Y g , 

I - I 

Y, = T.j/rij , 

k 

T = 1 Tj, 

j= 1 

k 

N = X«/- 

y= i 

Y = T../N. 

De nuevo, se emplea la notation de punto para indicar que la suma se lleva a cabo 
sobre el correspondiente subindice. En particular, T.j es la suma de las rij observa¬ 
ciones en el 7 -esimo tratamiento, Y.j es la media de la muestra dely'-esimo tratamien¬ 
to, T es la suma de todas las N observaciones y L. es la media de la muestra de to- 
das las observation^. 

A1 sustituir las estadlsticas Y.j y Y en (12.5) para los parametros p.j y p, respec- 
tivamente, se obtiene la correspondiente igualdad en la muestra 

Y u - Y = (Tj - Y.) + ( Y;j - Y.j). (12.6) 

La esencia de la identidad de la muestra (12.6) es la division de la desviacion de una ob¬ 
servation Yjj del promedio de la muestra total Y en dos componentes la desviacion 
de la media de la muestra del tratamiento Y t de Y. , y la desviacion de Y i} de su pro- 
pia media de tratamiento Y.j. De acuerdo con lo anterior, puede argumentarse en 
forma logica que entre mayor sea la desviacion entre Y } y Y . se tiene mas inclina- 
cion a rechazar la hipotesis nula dada por ( 12 . 3 ). 

Para determinar una estadistica de prueba apropiada, supongase que se toma 
el cuadrado de ambos miembros de (12.6) y se suman sobre todos los / y j. De esta 


j = 1 , 2 , ..., k , 
j = 1 , 2 , .... £, 
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forma. 


2 £ Wu - Y..) 2 = 2 2 (Yj - Y ) 2 + 22(Yu- Y.j ) 2 

/** r i— i j— i /= i j~ i /= i 

* rty 

+ 2 2 2 (Tj - ?..) ( Y tJ - Y.j). 
j= 1 1 -1 


Pero 


k !\j k 

2 2 (Y.J - Y ) ( Yi j - Y,) = 2 (Y.J - Y.) 

y=if=i y=i 

k 

= 2 (T, - 7) 

y=i 


2 - >V) 


2 y-v - njY.j 


= o, 

dado que Xfi, Y tj = T.j = njY.j. 

Como resultado se tiene que la ecuacion 

2 2 {Yu - Y.r = 22 (Y.J - y..) 2 + 22 (r w - T,) 2 

y= i f= i >= i i= i y-ii-i 


(12.7) 


( 12 . 8 ) 


establece que la suma total de los cuadrados de las desviaciones con respecto a la media 
global se descompone en la suma de los cuadrados de las desviaciones de las me- 
dias de los tratamientos en relacion con la media global, y la suma de los cuadrados 
de las desviaciones de las observaciones con respecto a sus propias medias de trata- 
miento. La expresion (12.8) se conoce como la ecuacion fundamental del analisis de 
varianza. El termino en el lado izquierdo de (12.8) es la suma total de cuadrados y se 
denota por STC. El termino en medio de (12.8) es la suma de los cuadrados de los 
tratamientos y se denota por SCTR. El ultimo termino es la suma de los cuadrados 
de los errores, denotada por SCE. Por lo tanto, 

STC = SCTR + SCE (12.9) 

SCE mide la cantidad de variacion en las observaciones debida a un error alea¬ 
torio. Si todas las observaciones que se encuentran dentro de un mismo tratamiento 
son las mismas, y si este hecho es cierto para todos los k tratamientos, entonces SCE 
- 0. De acuerdo con lo anterior, entre mas grande es SCE, mayor es la variacion en 
las observaciones que puede atribuirse a un error aleatorio. SCTR mide la extension 
de la variacion, en las observaciones, que se debe a las diferencias entre los tratamien¬ 
tos. Si todas las medias de los tratamientos son iguales entre si, entonces SCTR = 0. 
De esta forma, entre mas grande es el valor de SCTR, mayor es la diferencia que 
existe entre las medias de los tratamientos y la media global. 

Puede demostrarse que bajo la hipotesis nula H 0 : r ( = 0 y la suposicion de que 

— M0, <r ), SCTR/o -2 y SCE/rr 2 son dos variables aleatorias independientes con 
una distribucion chi-cuadrada. Los grados de libertad se obtienen al separar la suma 
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'total de cuadros. STC tiene TV-1 grados de libertad debido a que se pierde un grado 
de libertad al ser necesario que la suma de las desviaciones ( Y u - Y.) para toda kyj 
sea cero. La suma de los cuadrados de los tratamientos tiene k -1 grados de libertad 
debido a que se impone la restriccion tij ( Y.j - Y .) = 0 para las k desviaciones 
(Y.j - Y..). Esta restriccion surge del hecho de que 2*_i n/r, = 0. Entonces, con 
base en (12.9), el numero de grados de libertad para SCE sera igual a la diferencia 
entre el numero de grados de libertad para STC y SCTR, 

g r(SCE) = gl(STC) - gl(SCTR) 

= N - 1 - (k - 1 ) 

= N - k. 

Una suma de cuadrados dividido entre sus grados de libertad da origen a lo que se 
conoce como cuadrado medio. De acuerdo con lo anterior, el cuadrado medio del 
tratamiento es 

CMTR = SCTR/(A I), 
y el cuadrado medio del error es 

CME = SCE /(N - k). 

Ahora se puede argumentar que, dado que SCTR/cr y SCE/cr 2 son dos va¬ 
riables aleatorias independientes chi-cuadrada con k - 1 y N - k grados de libertad, 
respectivamente, entonces el cociente de las medias cuadraticas de la seccion 7.8 
tiene una distribution F con k -iy N -Vgrados de libertad. Este cociente es la 
estadistica apropiada para probar la hipotesis nula 

//„ : Tj = 0 . 

Lo anterior puede verificarse al examinar los valores esperados de los cuadrados 
medios. Puede demostrarse que 

£(CME) = o 2 


y 

X n j r j 

E(CMTR) = o- 2 + 2 f J — 
k - I 

en donde cr 2 es la varianza comun de los errores. Como resultado se tiene que el 
cuadrado medio del error es un estimador no sesgado de cr 2 sin importar si la hipote¬ 
sis nula es cierta. Por otro lado, si // 0 es cierta, t, = 0 para today, y = 0 

Entonces Z:(CMTR) = cr 2 ; es decir, bajo H v tanto CME como CMTR son estima- 
dores no sesgados de la varianza del error. Pero si la hipotesis nula no es de cierta, 
CMTR tiende generalmente a ser mayor que CME, dado que el termino 2 «,t; sera 
positivo. En otras palabras, entre mas grande sea la diferencia entre las medias de 
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los tratamientos y la media global, mayor ser<i CMTR. Pero una ocurrencia de este 
tipo sugiere que las medias de los k tratamientos no son todas iguales entre si y de 
esta forma debe rechazarse la hipdtesis nula. De acuerdo con lo anterior, la hip 6 tesis 
nula ser& rechazada cuando el valor del cociente. 

k nj 

2 2 (Yj - Y x ) 2 /(k - 1 ) 

F = - 3 - ( 12 . 10 ) 

2 2 (Yu - Y,) 2 /(N - k) 

j= ii=i 

se encuentre dentro de una region critica superior de tamano a. 

El analisis anterior constituye la tecnica del analisis de varianza para un experi- 
mento con solo un factor completamente aleatorizado. Las fuentes de variacion, 
grados de libertad, sumas de cuadrados, cuadrados medios, y el cociente F juntos, 
constituyen lo que se conoce como tabla de analisis de varianza (ANOVA) que se 
presenta en la tabla 12 . 2 . 

Dadas las verificaciones y tJ , j = 1, 2, ..., k, i = 1, 2, ..., tij, el calculo de las 
cantidades que aparecen en la tabla 12.2 puede hacerse en forma facil mediante el 
empleo de cualquier paquete estadistico estandar para computadora. Para llevar a 
cabo el calculo a mano, las sumas de los cuadrados pueden calcularse mediante el 
empleo de formulas algebraicamente equivalentes, pero desde un punto de vista de 
computation, mas convenientes 

k nj 

stc =2.2 ( y<j - y-) 2 

7=1 <=l 

k nj 

sctr =22 (y-7 - y ) 2 

7= I '= I 

SCE = STC - SCTR 

Debe notarse que la hipotesis nula H 0 : p. t = p 2 para el caso de dos muestras 
tambien puede manejarse con el metodo del analisis de varianza. En el capitulo 13 se 
mostrara la relacion que existe entre las estadlsticas Fy t de Student para k = 2. 


TABLA 12.2 Tabla de analisis de varianza para un experimento con solo un factor comple¬ 
tamente aleatorio 


= 2 2 y.7 - 77 ’ 


7= I >= I 

= A t 2 ) r-_ 
~ h nj N ’ 


Fuente de 
variacion gi 

SC 


CM 

Estadistica F 


Tratamientos k - I 

lHYj - Y )’ 

m y, - 

Y f/(k - 1) 

- Y.f/(k - 
F = -—- 

1) 

Error 

N - k 

Y„ - Y,f 

- 

Yj) ! /(N - k ) 

IS( Y„ - Y,) l /(N - 

k) 

Total 

N - 1 

2.H Yij - ~Y.y 
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TABLA 12.3 Calor empleado para cinco niveles de aislamiento 


Espesor del aislamiento del techo (pulgadas) 

4 6 8 10 12 


14.4 

14.5 

13.8 

13.0 

13.1 

14.8 

14.1 

14.1 

13.4 

12.8 

15.2 

14.6 

13.7 

13.2 

12.9 

14.3 

14.2 

13.6 


13.2 

14.6 


14.0 


13.3 


12.7 


Ejemplo 12.1 Los datos que figuran en la tabla 12.3 son los resultados de un dise¬ 
flo completamente aleatorizado para el cual la r.spcsta son los kilowats hora, 
empleados por los sistemas de calentamiento (en cientos de kilowats hora) para casas 
muy similares en un mes dado, como funcidn de cinco niveles de aislamiento termico 
(en pulgadas). Con base en esta informacion, <,existe alguna razon para creer que 
por lo menos algunos de los consumos de energia promedio para los cinco niveles de 
aislamiento son diferentes? Supongase un error de tipo I con a igual a 0.01. 


Se desea probar la hipotesis nula de que 

H 0 : Mi = P-2 = Pi = ^4 = Ms = 

o en forma equivalente 

H 0 :tj = 0, j = 1,2, .... 5. 

Los tamanos de las muestras son n , = 5, n 2 = 4, n } = 5, n 4 = 3, y n 5 = 6; asi 
que /V = 5 + 4 + ---+6 = 23. Las sumas de los tratamientos son T., = 73.3, 
T. 2 = 57.4, T.i — 69.2, T. 4 = 39.6, y T. 5 = 78. La suma total es T = 73.3 + 
57.4 + ••• + 78 = 317.5. Las sumas de los cuadrados son las siguientes: 


STC 

SCTR 

SCE 


, , , 317.5 2 

14.4 2 + 14.8 2 + ••• + 12.7 2 -— = 1 1.05, 

73.3 2 57.4 2 69.2 2 39.6 2 78 2 317.5 2 

5 + 4 + 5 + 3 + 6~23 

11.05 - 9.836 = 1.214. 


9.836, 


La informacion se ha agrupado en una tabla de analisis de varianza que se 
muestraen la tabla 12.4. Dado que/ = .36.48 >/ W4J1 = 4.58 se rechaza la hi¬ 
potesis nula de que no existe ningun efecto debido a los tratamientos. En relacion 
con lo anterior, existe una razon para creer que parte de los consumos promedio de 
energia son diferentes para los cinco niveles de aislamiento. 
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TABLA 12.4 Tabla ANOVA para el ejemplo 12.1 


Fuente de 
variacidn 

gl 

SC 

CM 

Valor F 

Tratamientos 

4 

9.836 

2.459 

36.48 

Error 

18 

1.214 

0.0674 


Total 

22 

11.05 

./o 99. 4. 18 = 

4.58 


12.4.2 Mbtodo de Scheffe para comparaciones multiples 

Recuerdese que la hipotesis altemativa en el analisis de varianza no especifica que 
medias son diferentes; lo que establece es que por lo menos una es diferente a las 
otras, asi que el rechazo de la hipbtesis nula con base en la estadistica F no puede 
emplearse como fundamento para aceptar una altemativa en particular. Por 
ejemplo, supongase que se rechaza la hipotesis nula H 0 : p , = p 2 = p 2 ; lo ante¬ 
rior significa que p. } es diferente, pero que p y p 2 son las mismas. O puede expresar 
que las tres medias son diferentes entre si, o cualquier otra combinacion posible de 
estos resultados. Por lo tanto, esta es una razon muy fuerte para que el investigador 
necesite un analisis mas completo para explorar las diferencias estadisticamente dis- 
cernibles entre cierto numero de medias de poblacion. 

Con este proposito se han propuesto varios metodos; entre estos se encuentran el 
procedimiento de rangos estudentizados de Tukey, la prueba de rangos multiples de 
Duncan y el metodos de Scheffe (vease [5]). Solo se analizara el metodo de Scheffe 
para comparaciones multiples debido a que tiene, en forma relativa, pocas restric- 
ciones y es preferido por muchos cuando se comparan combinaciones de las medias 
de los tratamientos. El metodo de Scheffe radica en la formulation de un contraste 
que es una comparacion que escoge el investigador para representar una combina¬ 
cion lineal de cualquier numero de medias de poblacion. Un contraste es un metodo 
general de comparacibn que permite al investigador determinar, con base en la evi- 
dencia de la muestra, si el contraste dado es estadisticamente discernible. 

Se define un contraste, denotado por L, como 

k 

^ = 2 c jl l J > ( 12 . 11 ) 

J= I 

en donde Pi es la media del y-esimo nivel, y las c/s son constantes tales que 
£* , Cj = 0. Por ejemplo, L = /z, - es un contraste con c, = 1 yt, = - I- 
Este contraste es una comparacion entre Mi y M 4 -Otro contraste es L = 3/x, - p-z 
- - /j. 4 ,con c, = 3, c 2 = Cj = c 4 = - 1. Este contraste es una comparacion 

entre y p. z , y p-a- De esta forma el metodo de Scheffe permite que el investi¬ 
gador escoja las comparaciones basadas en las caracteristicas de interes. 

Un estimador no sesgado de L esta dado por 

£ = 2 CjY.j, (12-12) 

j= i 
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cuya varianza se estima mediante 

k c 2 

s 2 (L) = CME —. (12.13) 

j-i«j 

Scheffe demostrd (vease [7]) que todos los posibles contrastes definidos por 
(12.11) se encuentran incluidos, con una probabilidad de 1 - a, en el conjunto de 
intervaios 


L - As{L)^L^L + As(L), (12.14) 

en donde 

A = \(k — k-t. N-k 

y L y s 2 (L) se definen mediante (12.12) y (12.13), respectivamente. Si para algun 
contraste L se obtiene un intervalo a partir de (12.14) que no incluye al cero, enton- 
ces el contraste es estadisticamente discernible. Por lo tanto, en realidad para cada 
contraste L se esta probando la hipotesis nula 


H 0 : L = 0. 

La esencia del conjunto de intervaios definidos por (12.14) es que para todos los 
intervaios el nivel de confianza es de 100(1 — a). Si se va a repetir un experimento 
muchas veces, y para cada una se calculan los invervalos de confianza para todos los 
posibles contrastes mediante el empleo de (12.14), entonces en un 100(1 - a) de las 
repeticiones, todos los intervaios de confianza seran correctos. Que el intervalo de 
confianza sea del 100(1 — a) para todos los intervaios, es mejor a obtener un inter¬ 
valo de confianza del 100(1 - a) para cada par de medias de tratamientos, en cuyo 
caso el nivel de confianza solo es para cada par individual y no para el conjunto en- 
tero de estos. 

Ejemplo 12.2 En el ejemplo 12.1, comparese /x 4 contra p 5 ; m 2 , y M 4 contra 
M?; Mi contra p 2 ; y /ij y contra /x 5 , empleando el metodo de Scheffe con 
a = 0.01. 

Aunque pueden efectuarse comparaciones entre diversas combinaciones de los 
tratamientos, ciertas comparaciones parecen razonables si el objetivo es el orde- 
nar los tratamientos en subgrupos dentro de los cuales no aparezca ninguna diferen- 
cia apreciable. Por ejemplo, si no existe una diferencia discernible entre el empleo de 
energia promedio para aislamientos termicos de 10 y 12 pulgadas, puede ser, desde 
un punto de vista economico, mas razonable utilizar un aislamiento de 10 pulgadas 
que uno de 12. Los contrastes para las cuatro comparaciones son: 

L x = Mj - Ms > ^-2 = M: + M3 + M4 _ , 

= Mi ~ Mi’ E 4 = 2/j.f — p.} — p. 4 . 

Se ilustrara el calculo del intervalo de confianza para L 2 . Dado que y 2 = 14.35. 

www. FreeLibros. com 


12.4 Analisis de experimentos unifactoriales en un diseflo complelamente aleatorio 415 


y 3 = 13.84, y . 4 = 13.2, y y . 5 = 13, 

t 2 = 14.35 + 13.84 + 13.2 - (3)(13) = 2.39. 


La varianza estimada es 


y 


s 2 (L 2 ) = 0.0674 



(~3 ) 3 

6 


0.1539, 


j(£ 2 ) = 0.3923. 


Dado que / 0 99 4> , g = 4.58, A = \/(4)(4.58) = 4.28, el intervalo de confianza 
para L 2 es 


2.39 ± (4.28X0.3923) = (0.7109,4.0691). 

A1 seguir el mismo procedimiento se obtiene que los intervalos de confianza para los 
otros contrastes son 


L, : (- 0.5857,0.9857), 

Z -3 : (- 0.4354,1.0554), 

L 4 : (- 2.2572,0.1772). 

Notese que de los cuatro intervalos de confianza para los contrastes de interes solo 
ei de L 2 no incluye el valor cero. Dado que la inclusion de este valor en estos interva¬ 
los de confianza es equivalente a la falta de significancia estadistica en una prueba 
bilateral con respecto a la diferencia entre las medias, una comparacion de los cuatro 
intervalos revela que no existe ninguna diferencia apreciable en el consumo de 
energia promedio para un grosor del aislamiento termico de 8 , 10 o 12 pulgadas. Se 
llega a esta conclusion debido a que los contrastes L, y L 4 no son estadisticamente 
discernibles, pero L 2 si lo es. Dado que L 2 es igual que L 4 excepto que este contiene a 
M 2 (6 pulgadas de aislamiento), con base en los resultados de este experimento puede 
considerarse a un aislamiento de 8 pulgadas de espesor, como optimo, desde un pun- 
to de vista economico. 

Debe notarse que si se rechaza la hipotesis nula de medias iguales mediante el 
empleo de la estadistica F, entonces el metodo de Scheffe dara por lo menos un 
contraste que es estadisticamente significativo. 


12.4.3 Analisis de residuos y efectos de la violacion de las suposiciones 

De la seccion 9.6.3. recuerdese que, para muestras de diferente tamafto, el efecto de 
violar la suposicion de varianzas iguales cuando se comparan dos medias puede ser 
sustancial. Dado que esta misma suposicion se formula cuando se comparan k me¬ 
dias, se de'sean examinar las formas en que lo anterior puede detectarse y analizar los 
efectos sobre la inferencia cuando no violan las suposiciones. 
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Una forma sencilla y util para detectar la discrepancia con el modelo propuesto 
se basa en un analisis de residuos. Un residua es un estimador del error aleatorio e, 7 . 
Dado que 

B ij = Yij ~ l*j, 

el residuo correspondiente denotado por e Ut se define como 

e,j = y u - y.j, j = 1 , 2 , k, i = 1, 2 , rij. 

Los residuos no son estimados en el sentido de estimation de parametros, sino 
como estimadores de los valores de las variables aleatorias no observables e u con 
base en los estimadores y.j para los k medias de poblacion. 

Si es valida la suposicion de que los errores aleatorios tienen las mismas varian- 
zas para todos los niveles de k, entonces una gr&fica de los residuos de cada trata- 
miento no revelar4 ninguna diferencia apreciable en la dispersidn de los residuos alre- 
dedor del cero. Si esta dispersion es notablemente diferente para algunos tratamien- 
tos, entonces es posible que las varianzas no sean iguales para todos los tratamien- 
tos. Para normalizar la escala de ma gnitudes de los residuos es preferible emplear los 
residuos estandarizados e/j/y/C ME. Entonces, dado que por hipotesis los errores 
aleatorios se encuentran normalmente distribuidos, un residuo estandarizado rara 
vez se encontrara mas alia de un intervalo de ± 3 

Se ilustrara el ana lisis d e residuos empleando los datos del ejemplo 12.1. Dado 
que y.i = 14.66 y \/CME = 0.25%, los residuos para el primer tratamiento son 
14.4 - 14.66 = -0.26, 14.8 - 14.66 = 0.14, 15.2 - 14.66 = 0.54, 14.3 - 
14.66 = -0.36, y 14.6. - 14.66 = -0.06, y los residuos correspondientes estandari¬ 
zados son -1.00,0.54, 2.08, -1.39 y -0.23. A1 seguir este procedimiento se obtienen 
todos los residuos estandarizados que aparecen en la tabla 12.5. 

La figura 12.1 ilustra los residuos estandarizados para cada tratamiento. Se ob- 
serva que no existe ninguna diferencia notable en la dispersion para cada uno de los 
cinco tratamientos excepto para uno de los residuos del primer tratamiento. De 
acuerdo con lo anterior, parece que la hipotesis de que las varianzas de los cinco tra¬ 
tamientos son las mismas, es razonable en este caso. Tambien se encuentran dispo- 
nibles en la literatura estadistica procedimientos formales para verificar la hipotesis 
de igualdad entre las k varianzas. Dos de los usados con mas frecuencia son la 
prueba de Bartlett y la prueba de Hartley. Se invita al lector a que consulte [5] para 
conocer los detalles. 


TABLA 12.5 Residuos estandarizados para el ejemplo 12.1 


4 

6 

8 

10 

12 

- 1.00 

0.58 

- 0.15 

- 0.77 

0.39 

0.54 

- 0.96 

1.00 

0.77 

- 0.77 

2.08 

0.96 

- 0.54 

0 

- 0.39 

- 1.39 

- 0.58 

- 0.92 


0.77 

- 0.23 


0.62 


1.16 





- 1.16 
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FIGURA 12.1 Grafica de los residuos estandarizados para los dneo tratamientos del ejemplo 12.1 


Como se examino en el capitulo 9, el efecto sobre las inferencias con respecto a 
las medias, cuando los errores aleatorios no se encuentran normalmente distri- 
buidos, es menor mientras el alejamiento de la normalidad no sea muy severo. De es- 
ta forma, la estadistica Fen el analisis de varianza es robusta con respecto a los ale- 
jamientos de la hipotesis de normalidad. Si las varianzas de todos los tratamientos 
no son iguales entre si, puede aumentarse el tamaflo de la region critica de la 
estadistica F para el caso de efectos fijos; pero, como se analizo en el capitulo 9, 
este efecto puede minimizarse mediante el empleo de muestras de igual tamaflo para 
cada tratamiento. En otras palabras, en el analisis de varianza, la estadistica F tam- 
bien es mas robusta ante varianzas desiguales siempre y cuando los tamaflos de la 
muestra de los tratamientos sean iguales. Desafortunadamente este resultado no se 
extiende al caso de efectos aleatorios en el que la violacion de la hipotesis de varian¬ 
zas iguales generalmente tendra efectos considerables sobre las inferencias aun para 
muestras del mismo tamaflo. 

La hipotesis' crucial en el desarrollo del analisis de varianza es que los errores 
aleatorios son independientes. Si los errores son interdependientes, el tamaflo real de 
la region critica puede ser, en forma substancial, mas grande (cinco o mas veces) que 
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el tamaflo dictado al seleccionar la probabilidad del error de tipo I. Se invita al lec¬ 
tor a que consulte [3], para una revision de las consecuencias que surgen al violar las 
suposiciones en el analisis de varianza. 


12.4.4 El caso de efectos aleatorios 

Para introducir el caso de efectos aleatorios se utilizara el siguiente analisis breve. Para 
una presentacibn mas completa se sugiere consultar [6]. Para el modelo de efectos 
aleatorios se formulb la suposicion de que los niveles empleados en el experimento 
fueron seleccionados en forma aleatoria de una poblacibn de posibles niveles. Ade- 
mas se supondra que r y ~ 7V(0,crJ), en donde cr; es la varianza de los tratamientos 
aleatorios r,. La descomposicibn de la suma total de cuadrados y el analisis de va¬ 
rianza es igual a la del caso de efectos fijos para un experimento con solo un factor, 
pero en este caso el valor esperado del cuadrado medio de tratamiento *s diferente. 
Dadas muestras de igual tamaflo n para todos lo r niveles, se puede demostrar que 

£(CME) = a 2 , 

y (12.15) 

£(CMTR) = a 2 + na\. 

La region apropiada de rechazo sigue siendo la misma ya que un valor grande 
del cociente entre CMTR y CME sugiere que debe rechazarse la hipotesis nula 

H 0 : a 2 r = 0 

Ejemplo 12.3 Una planta de enlatado emplea un numero muy grande de maquinas 
para su proceso de llenado. Se da por hecho que cada maquina vacia un peso especi- 
ficado del producto en cada lata. El gerente de la planta sospecha que existe una 
gran variacion en la cantidad del producto que se vacia entre las distintas maquinas. 
Para verificar su sospecha, escoge al azar cuatro maquinas y pesa el contenido de 
cinco latas, seleccionadas en forma aleatoria, llenadas por cada una de las cuatro 
maquinas. Los resultados se muestran en la tabla 12.6. <,Que proporcion de la va¬ 
rianza en los pesos puede atribuirse a las diferencias que existen entre las maquinas? 

Primero se llevara a cabo un analisis de varianza para saber si puede rechazarse 
H a -al =0. Los totales de las maquinas son 7 , = 6.14, T 2 = 6.03, T 2 = 5.99 y 


TABLA 12.6 Contenido en peso para un proceso de llenado 


1 

Maquina 

2 

3 

4 

1.24 

1.20 

1.19 

1.18 

1.22 

1.20 

1.20 

1.18 

1.22 

1.21 

1.19 

1.19 

1.23 

1.22 

1.20 

1.18 

1.23 

1.20 

1.21 

1.20 
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TABLA 12.7 Tabla ANOVA para el ejemplo 12.3 


Fuertte de 
variacidn 

gl 

SC 

CM 

Valor F 

Tratamientos 

3 

0.004695 

0.001565 

20.87 

Error 

16 

0.0012 

0.000075 


Total 

19 

0.005895 

/o.95. 3. 16 

= 3.24 


T 4 = 5.93. El total global es T. = 24.09, y los 
son n = 5. Entonces 

STC = 1.24' + 1.22 2 + — + 1.20 2 - 

6.14 2 + 6.03 2 + S.99 2 + 5.93 2 
SCTR = --- 

SCE = 0.005895 - 0.004695 = 0.0012. 


tamarios de todas las muestras 


24.09 2 _ 
20 

_ 24.09 2 
20 


0.005895, 

= 0.004695, 


La tabla ANOVA se da en la tabla 12.7. Dado que / = 20.87 > / 0 . 95 . 3 , , 6 = 3.24, 
se rechaza la hipotesis nula de que no hay variation debida a las maquinas. 

Para estimar la varianza en los pesos y que proportion de esta puede atribuirse a 
las diferencias entre las maquinas, recuerdese que para un modelo de efectos aleato- 
rios 

Var(Yij) = a 2 + ct 2 t . 

De (12.15), un estimado de cr 2 es CME = 0.000075, y un estimador de cr 2 +5crjes 
CMTR = 0.001565. En otras palabras, 

0.000075 + 5s 2 = 0.001565 

, 0.001565 - 0.000075 

" 5 

= 0.000298 

es un estimador de a 2 . Entonces un estimador de la varianza en el peso es 

s 2 ( Yjj) = 0.000075 + 0.000298 
= 0.000373, 

de la cual 0.000298/0.000373, o el 79.89%, se debe a diferencias entre las maquinas. 
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12.5 Analisis de experimentos con solo un factor en un diseno en 
bloque completamente aleatorizado 

Recuerdese que cuando las unidades experimentales no son homogeneas, se introdu¬ 
ce una fuente potencial de variacion que, en general, puede afectar la inferencia con 
respecto al factor de interes. En estos casos es necesario emplear un diseiio alea¬ 
torizado para remover la fuente externa de variacion con lo que se incrementa la sen- 
sitividad para detectar diferencias entre los tratamientos de interes. 


Ejemplo 12.4 La agencia de Protection del Medio Ambiente (APMA) anualmente 
clasifica de acuerdo con la eficiencia en el quemado de combustible a todos los auto- 
moviles disponibles para venta de Estados Unidos. Sin embargo, es un heeho muy 
conocido que las clasificaciones de la APMA se basan, principalmente, en pruebas 
de laboratorio y de esta forma se tiende a sobreestimar la eficiencia real en el quema¬ 
do de combustible. Una empresa independiente desea determinar si existe una dife- 
rencia, estadisticamente discernible, en la eficiencia del quemado promedio de com¬ 
bustible bajo condiciones de rodamiento real para cinco automoviles compactos que 
tienen la misma clasificacion APMA. La empresa tiene acceso a un recorrido de 
400 millas que incluye tanto el manejo en ciudad como en carretera. Estudiense los 
aspectos de diseflo de este experimento. 


Es claro que los tratamientos estan constituidos por los cinco automoviles y que 
la respuesta medible es el numero de millas por galon logradas por los automoviles 
durante el recorrido de 400 millas. Pero, £CUcil es la unidad experimental?; esta tiene 
que ser la persona que maneja el automovil, pero no es comun que una empresa que 
realiza pruebas utilice un conductor para todo el experimento. Supongase que se es- 
cogen cuatro conductores para el experimento. Aunque la empresa explicara el pro- 
posito del experimento en forma breve, a los conductores ya se ha introducido otra 
fuente de posible variacion. No importa que tan similares sean los conductores entre 
si; a pesar de todo existe un riesgo potencial de tener efectos por los conductores que 
pueden tomarse en cuenta mediante la creation de cuatro bloques, uno para cada 
conductor, de tal manera que los tratamientos dentro de cada bloque (los cinco 
automoviles) se apliquen a unidades experimentales homogeneas (el mismo conduc¬ 
tor). La pregunta que surge en este momento es, icomo asignar los automoviles a los 
conductores? El diseflo aleatorizado especifica que la asignacion de los tratamientos 
a las unidades experimentales dentro de cada bloque debe hacerse en forma aleato- 
ria. De esta manera, para asignar el orden en el cual seran manejados los automovi¬ 
les por cada conductor, se concibe un proceso de selection aleatorio simple. Por 
ejemplo, la asignacion puede hacerse de acuerdo con la tabla 12.8, la cual constituye 
un diseflo en bloque completamente aleatorizado. 

A continuation se analizara un experimento con solo un factor en un diseflo en 
bloques completamente aleatorizado. Primero sera necesario generalizar para des¬ 
pues regresar al ejemplo de la eficiencia en consumo de combustible e ilustrar los pa- 
sos del calculo. Las observaciones del experimento pueden colocarse como se mues- 
tran en la tabla 12.9. 
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TABLA 12.8 Diseflo en bloque completamente aleatorizado para el ejemplo 12.4 


1 

2 

Conductor 

4 


A| 

A5 

A« 

A 2 


Automdvil 

A 3 A 5 A« A 2 

A 3 a 4 a 2 a, 

A] \ A 5 A 3 A 2 

A5 A 4 A1 A3 


Sup 6 ngase que se tienen k tratamientos y n bloques, el modelo matematico para 
un diseflo con solo un factor en bloques completamente aleatorizado es 

Yij = p + (3 i + Tj + By i = 1, 2, ...-, n, (12.16) 

j = 1, 2, .... k, 

en donde Y :J es la observation de la respuesta en el t-esimo bloque y bajo el y'-esimo 
tratamiento, Mes la mediaglobal, /3, es el efecto sobre la respuesta debido al f-esimo 
bloque, r, es el efecto debido aly'-esimo tratamiento y s 0 es el error aleatorio. Como 
en el caso anterior, se da por hecho que los errores son variables aleatorias indepen- 
dientes, tales que ~ N( 0, a 2 ) para toda i y y. Si tanto los tratamientos como los 
bloques son de efectos fijos, entonces las /3,’y los r/ son parametros fijos que repre- 
sentan desviaciones de las medias de los bloques y los tratamientos de la media glo¬ 
bal, respectivamente. En otras palabras, 

/3, = Pi- - p, i = 1, 2, ..., n, (12.17) 

7 i = P-j ~ j = 1, 2, /c, 

en donde /u,. y p.j son las medias de las poblacion para el i-esimo bloque y el y-esimo 
tratamiento, respectivamente. 

Al igual que en el diseflo completamente aleatorizado, se supone que las varianzas de 
la poblacion para todos los tratamientos son iguales. Tambien debe suponerse que el 
efecto del tratamiento sobre la respuesta es el mismo para todos los bloques; en otras 


TABLA 12.9 Arreglo comun de las observaciones para un diseflo con solo un factor en blo¬ 
que completamente aleatorizado 




1 

2 

Tratamiento 

j 

k 


1 

Yu 

Yn. 

Yu 

Y\ k 


2 

Y 21 

Y 22 

y 2j 

Y, k 

Bloque 

/ i 

Yn 

Y,2 

Y, 

Y, k 


n 

Y nl 

Y n2 

Yn, 

Y„ k 
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palabras, puede obtenerse la misma conclusion a partir de todos los bloques con res- 
pecto al efecto del tratamiento. Cuando esto ocurre se dice que los tratamientos y los 
bloques no interaction, y sus efectos individuals sobre la respuesta son aditivos. La 
nocion de interaction entre dos factores se examinara en la siguiente seceion. 

Para un diseiio de un s61o factor en bloque completamente aleatorizado, el prin¬ 
cipal propdsito es determinar si las diferencias en los tratamientos son estadistica- 
mente significativas, es decir, para el caso de efectos fijos se desea probar la hipote- 
sis nula 


H 0 : Tj = 0, j = 1, 2, k. 

El lector puede sorprenderse con respecto al efecto del bloque, pero el interes, en rea¬ 
lidad, no recae en determinar si este es estadisticamente apreciable. Todo lo que se 
desea hacer es aislar el efecto del bloque y removerlo del error experimental, de tal 
manera que se incremente la e'xie-’cia para detectar diferencias reales entre los tra¬ 
tamiento'!, si es que estas existen. 

Para el procedimiento del analisis de varianza, puede escribirse el modelo dado 
por (12.16) como 

= Y;j - p - A - Tj. (12.18) 

Al sustituir (12.17) para A y t, en (12.18), se tiene 

e ij = Yij ~ P ~ Pi + P ~ Pj + p- (12.19) 

Ahora, al reemplazar (12.17) para A y r, y (12.19) para 7 e, 7 en (12.16) se obtiene la 
siguiente identidad: f 

Yij ~ p- = (p, ~ p) + ipj - p) + (Yij - Pr ~ Pj + PY 02.20) 

En otras palabras, la desviacion de una observacion con respecto a la media global 
tiene tres componentes (la desviacion debida a los bloques, a los tratamientos y al 
error aleatorio). 

Para las observaciones que se encuentran en la tabla 12.9 se definen las siguientes 
estadisticas: 


k 

T,. = 2 Y,j, ~Y h = Tj/k, i = 1,2. n 

j= i 

n 

Tj=J l Y ij , Yj = T.j/n, y=1.2,...,* 

I- I 
// k 

i = S S Y„, y = T Ink. 

i- i j— i 

Por lo tanto, la identidad en terminos de la muestra correspondiente a (12.20) es 
Y u ~ Y = (Y, - Y ) + (Yj - Y ) + (Yij - Y, - Yj + Y ). 
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A1 elevar al cuadrado ambos miembros y llevar acabo lasuma sobre iyjse tienela 
relacion 

2 2 (y u - y..) 2 = 22 (Yr - Y.y + 22 (7, - y? 

i** I j~ I i=l>*l i=\j=\ 

n k 

+ 22 (Yu - Y, - Y.j + 7..) 2 , 

/= i j -1 

en donde puede demostrarse que los tres terminos que contienen productos cruzados 
se reducen a cero. Esta es la ecuacion fundamental para el analisis de varianza, y es- 
tablece que la suma total de los cuadrados STC se separa en la suma de los cuadra- 
dos de los bloques SCB, la suma de los cuadrados de los tratamientos SCTR y la 
suma de los cuadrados de los errores SCE. 

Por causa de la restriction £" = , 2*., ( Y tJ - 7 .) = 0, el numero de grados de li- 
bertad para STC es igual a nk - 1 . En forma similar, por causa de las rcstricciones 
i (Y, - Y ) - 0 y (Y.j - Y ) = 0, el numero de grados de libertad 
para SCB y SCTR son iguales an-lyk-l, respectivamente. Se sigue que 

gl(SCE) = gl(STC) - gl(SCB) - gl(SCTR) 

= nk - 1 - (n - 1 ) - (k ~ 1 ) 

= {n- \)(k - 1). 

Puede demostrarse que bajo las suposiciones del modelo y la hipotesis H 0 : tj = 
0, SCTR/cr 2 y SCE/o - 2 son dos variables aleatorias independientes con una 
distribucibn chi-cuadrada con k - 1 y (n - 1) (Ar - 1) grados de libertad, en forma 
correspondiente. Tambien puede demostrarse que los valores esperados de los 
cuadrados medios del error y del tratamiento son 

E(CME) = o - 2 

y 

nil1 

£(CMTR) — o~ 2 + yz~[- 

Entonces, con base en el argumento previo, la estadistica de prueba apropiada es el 
cociente de los cuadrados medios del tratamiento y del error, el cual tiene una distri- 
bucion Fcon k - 1 y (n - 1) (k - 1) grados de libertad. Como antes, se sugiere una re¬ 
gion critica de tamano a, ya que un valor grande del cociente tiende a implicar que 
no todas las medias de los tratamientos son las mismas. El analisis de varianza apa- 
rece en la tabla 12 . 10 . 

Debe notarse que es posible una prueba para el efecto de bloque al formar el co¬ 
ciente entre CMB y CME y compararlo con la region critica que se encuentra en el 
extremo superior de una distribucion Fcon n - 1 y (n - 1 ) (k - 1 ) grados de libertad. 

www. FreeLibros. com 



424 Disedo y analisis de experimentos estadisticos 


TAB LA 12.10 Tabla de analisis de varianza para un experimento con solo un factor en blo- 
que completamente aleatorizado 


Fuente de 
variacion 

gi 


sc 

CM Estadistica F 

Bloques 

n - 

i 

2Y(Y, - 

Y) 1 





_ 


_ CMTR 

Tratamientosit - 

i 

yziY.j - 

yy 

CMTR = SCTR /(k - 1) F = — — 

CME 

Error 

(n - 

lx* - 

1) - 

Y, - Yj + 

Y.y CME = SCE/(n - m - 1) 

Total 

nk - 

i 

- 

y y 



Lo anterior no constituye en realidad una parte integral del analisis. Despues de 
todc, se escoge un bloque completamente aleatorizado para un experimento con s6- 
lo un factor para remover el efecto potencial de la fuente de variacion extr„na. Si tal 
efecto es estadisticamentc significativo, realmente no es de gran interes. 

Para realizar calculos a mano, es preferible emplear las siguientes formulas que 
son equivalentes, en un sentido algebraico, para obtener las sumas de cuadrados. 


n k 


STC = 2 £ y\ 

>= I 7= « 


Tl 

nk 


SCB = - 2 Tl 


i=i 


Tl 

nk 


SCTR = - V T 
n , 


2 

j 


Tl 

nk 


SCE = STC - SCB - SCTR 

Para ilustrar los pasos de calculo, supongase que los resultados del experimento 
descrito en el ejemplo 12.4 son los que se muestran en la tabla 12.11 (las mediciones 
estan dadas en millas por galon para un recorrido de 400 millas). Para probar la hi- 
potesis nula 


H 0 : Tj - 0, j = 1,2, ..., 5, 
las sumas de cuadrados dan 

672 4 2 

STC = 33.6 2 + 36.9 2 + ••• + 32.8 2 - —= 102.212, 

SCB - 1M± - + ' 72 4: - , 4L676 , 

5 20 

SCTR = + - 9 = 38.092. 

4 20 
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TABLA 12.11 Datos experimentales para el ejemplo 12.4 


Automovil 


Conductor 

Ai 

a 2 

A3 

A4 

^5 

Totales 

1 

33.6 

32.8 

31.9 

27.2 

30.6 

T, = 156.1 

2 

36.9 

36.1 

32.1 

34.4 

35.3 

T 2 = 174.8 

3 

34.2 

35.3 

33.7 

31.3 

34.6 

7V = 169.1 

4 

34.8 

37.1 

34.8 

32.9 

32.8 

r 4 . = 172.4 

Totales T. t 

= 139.5 

r. 2 = 141.3 

T, = 132.5 

r. 4 = 125.8 

T .5 = 133.3 

T = 672.4 


SCE = 102.212 - 41.676 - 38.092 = 22.444. 


LatablaANOVAseencuentradadaenlatablal2.12.Dadoque/ = 5.09 >f 0 . 95 . 4 .12 
= 3.26, se rechaza la hipotesis nula de igualdad de efecto de tratamiento. Por 
lo tanto, existe una razdn para creer que las eficiencias en consumo medio de com¬ 
bustible de algunos de estos automoviles no son iguales. 

La identification y eliminacibn del efecto de los bloques de la variation total per- 
mite que se hagan comparaciones multiples sobre los tratamientos, como ya se vio 
en la section 12.4.2. Pueden definirse y probarse un gran numero de contrastes para 
determinar si son estadisticamente apreciables al seguir el procedimiento delineado 
en la seccion 12.4.2. La unica exception es que la cantidad denotada por A en 
(12.14) ahora esta dada por 

A = y/(k — l)/i -a. k- I. (n- !)(*-I). 


A veces los bloques no son de efectos fijos, es decir, se eligen para el experimento 
en forma aleatoria de una poblacion de posibles bloques. Si los tratamientos son de 
efectos fijos, la unica diferencia con respecto al caso previo se encuentra en la supo- 
sicion de /3,; i.e., fi, ~ N{ 0, cr|); pero el analisis sigue siendo el mismo, aun para 
comparaciones multiples entre los tratamientos. 

Ademas de la suposicion de independencia, se hacen dos suposiciones clave para 
un diseiio en bloques aleatorizados: las varianzas de cada tratamiento son iguales y 


TABLA 12.12 Tabla ANOVA para el ejemplo 12.4 


Fuente de 
variacion 

gl 

SC 

CM 

Valor F 

Bloques 

3 

41.676 



Tratamientos 

4 

38.092 

9.523 

5.09 

Error 

12 

22.444 

1.870 


Total 

19 

102.212 

To. 95 . 9 . 12 

= 3.26 
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los bloques y tratamientos no interaction. La presencia de interaccibn entre bloques 
y tratamientos implica que no es posible evaluar el efecto del tratamiento sobreto- 
dos los bloques, sino que este se debe describir en forma individual para cada blo- 
que. Si adem<is los efectos del bloque y del tratamiento son aditivos, la estadlstica F 
no es sensitiva a la violacibn de la suposicion de varianzas iguales; para estas, si existe 
una interaccidn entre bloques y tratamientos, la estadlstica F se encuentra sesgada 
negativamente, es decir, si se rechaza la hipotesis nula de que no existe diferencia al- 
guna entre los tratamientos, entonces puede confiarse en que existe una diferencia 
entre los tratamientos. Pero si la hipdtesis nula no se rechaza, esto se puede deber, ya 
sea a un sesgo negativo (la presencia de interaccion) o a la ausencia de diferencias 
entre los tratamientos. Puede emplearse un procedimiento desarrollado por Tukey, 
el cual se describe en [4], para probar la interaccion entre bloques y tratamientos. 

Si se violan tanto la suposicion de varianzas iguales como la de aditividad, la 
estadlstica F para las diferencias en los tratamientos tiene un sesgo positivo; en otras 
palabras, si se rechaza la hipdtesis nula de que no existe ninguna diferencia entre los 
tratamientos, esto no necesariamente implica que las diferencias entre los tratamien¬ 
tos sean estadisticamente significativas. Cuando existe preocupacidn sobre estas su- 
posiciones, debe usarse una prueba F conservadora desarrollada por Geisser y 
Greenhouse (vease [4]). Los pasos de calculo para esta prueba son iguales a los del 
metodo convencional ya descrito, excepto que el numero de grados de libertad para 
este caso es de 1 y n -1 en lugar de k - 1 y (n -1) (k -1), para cada uno. Si para am- 
bas pruebas se rechaza la hipotesis nula, puede tenerse la seguridad de que las dife¬ 
rencias entre los tratamientos son estadisticamente significativas. Si ambas pruebas 
no rechazan a H 0 , entonces se puede proceder como si no existiese diferencia alguna 
entre los tratamientos. 


12.6 Experimentos factorials 

Hasta este momento la presentation se ha dirigido hacia el analisis del efecto de un 
factor sobre la variable respuesta. Pero en muchas situaciones practicas es necesario 
investigar, en forma simultanea, los efectos que tienen varios factores sobre la res¬ 
puesta. Una forma muy eficiente de lograr lo anterior es mediante el uso de un expe¬ 
riment© factorial en el que todos los niveles de un factor se combinan con todos los 
niveles de cualquier otro para formar los tratamientos. Por ejemplo, en un experi- 
mento factorial de dos factores en el que uno tiene tres niveles y el otro dos, existiran 
3x2 = 6 tratamientos. En otras palabras, la respuesta sera observada bajo seis tra¬ 
tamientos diferentes. 

Con los experimentos factoriales no solo es posible evaluar los efectos indivi- 
duales de los factores sobre la respuesta, sino que tambien es posible determinar el 
efecto causado por sus interacciones. El efecto de un factor sobre uria respuesta es 
simplemente el cambio en esta, causado por un cambio en el nivel del factor. Pero si 
el efecto de un factor sobre la respuesta es diferente para distintos niveles de otro 
factor, entonces se dice que los dos factores interactuan entre si. La presencia de in¬ 
teraccion indica que el efecto de los factores sobre la respuesta es no lineal y de esta 
forma no puede asumirse un modelo aditivo. 
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Para ilustrar la interaction entre dos factores, considerese lo siguiente. Un fabri- 
cante de partes electronicas emplea dos homos y dos temperaturas con el prop6sito 
de probar la duration de cierto componente. Se seleccionan cuatro components de 
algun lote y se prueba su duration de acuerdo con las cuatro combinations posibls 
de hornos y temperaturas. El tiempo de duracibn de los components en horas s el 
siguiente: \ 

_ Q\ _ O2 

T t 6.29 5.95 

T 2 5.80 6.32 


Los tratamientos para las cuatro posibles combinaciones de hornos y temperatu- 
rasson: O t T ]y O t T 2 , 0 2 T, ,y 0 2 T 2 . La diferenciaen duracion para los tratamientos 
0 1 T 2 y O, T, reprsenta un stimador del efecto en la duration de los components en 
el primer homo, a consecuencia de un cambio en la temperatura. Se observa que ste 
estimador s 5.80 - 6.29 = -u.49. La diferencia en duration para los tratamientos 
0 2 T 2 y 0 2 T , tambien es un estimador del efecto de la temperatura sobre la duracion, 
pero ahora en el segundo homo. Esta diferencia es de 6.32 - 5.95 = 0.37.Dado 
que estos dos estimadores son bastantes diferentes entre si, el efecto de la temperatu¬ 
ra en la duracion del componente depende del homo en que este se coloque. De sta 
forma, existe una interaction entre el homo y la temperatura. Tambien se observa la 
misma ocurrencia al estimar el efecto del homo para T t (5.95 — 6.29 = -0.34) y 
T 2 ( 6.32 - 5.80 = 0.52). Estos resultados se ilustran en forma grafica en la figu- 
ra 12.2 en donde el eje y representa las observaciones de la respusta; el eje x repre- 


FIGURA 12.2 Efectos que interaction 
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senta los niveles de un factor y los puntos graficados representan a cada nivel del 
otro factor. Si existe poca interaccibn entre el horno y la temperatura, las lineas que 
aparecen en la gr&fica serian casi paralelas. 

La determinacibn de si los efectos individuales o interacciones son estadistica- 
mente apreciables puede hacerse s61o mediante inferencia estadistica y no mediante 
el empleo de un analisis gr<tfico. En los siguientes parrafos se examinar<i un modelo 
no aditivo para un experimento factorial de dos factores en un diseflo completamen- 
te aleatorizado. Se pueden analizar experimentos factoriales con mas de dos factores 
mediante la extensibn del procedimiento que a continuacibn se examina. 

En un experimento factorial que incluye dos factores Ay B con ay b niveles, res- 
pectivamente, el numero de tratamientos es igual a a x b. Si no se puede suponer un 
modelo aditivo (no interaccion), solo es posible una prueba para determinar si 
un efecto por interaccibn es estadisticamente apreciable, si se toma mas de una ob- 
servacibn de la respuesta para cada tratamiento. Lo anterior se debe a que no puede 
determinarse para cada estimador de la variacibn del error aleatorio a menos que la 
respuesta se observe mas de una vez cada tratamiento, es decir, la evaluacibn de 
la variacibn del error aleatorio se basa en las diferencias en la respuesta observada 
bajo el mismo tratamiento. No est& por demas notar que para un diseflo completa- 
mente aleatorizado, los tratamientos deben aplicarse a unidades experimentales ho- 
mogeneas sin importar cuantas veces se repita el proceso. 

Si se suponen n aplicaciones de los ab tratamientos, el modelo matematico no 
aditivo para un factorial de dos factores es 

Yijk = p. + at + fa + ( a(3)ij + e iJk i = 1 , 2 . a, ( 12 . 21 ) 

j= 1,2. b, 

k = 1 , 2 , ..., n, 

en donde Y iJk es la /c-esima observacion de la respuesta para el tratamiento (/, j),p es 
la media global, a, es el efecto principal causado por el /-esimo nivel de A, fy es el 
efecto principal causado por el y-esimo nivel de B, (a/3),, es el efecto de interaccibn 
para el /'-esimo nivel de A y el y-esimo nivel de B y e ijk es el £-esimo error aleatorio en 
el tratamiento (/, j). Como antes, se supone que las varianzas de la poblacion para 
cada uno de los ab tratamientos son iguales, y que los errores aleatorios son va¬ 
riables aleatorias independientes, normalmente distribuidas, con medias iguales a 
cero y varianza comun o- : . 

Si se supone que los factores Ay B son de efectos fijos, entonces a,, /3 ), y (af3) 0 
son parametros fijos, tales que 


2 a, = 2 A = 0 

,=i ;=i 

y 

a b 

2 ( a Ph = S ~ °- 

1=1 7=1 
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para toda 

Las siguientes hipotesis son de interest 

1. H 0 :(af3) u = 0 para toda/ y j, 

2 . //„:«, = 0 para toda/, 

3. H 0 :(3j = 0 para toda j. 

Las ultimas dos hipotesis incluyen los efectos (individuales) principales de los facto- 
res A y B, y la primera hipotesis pertenece a la posible interaccibn entre A y B. Si 
existe una fuerie interaction entre A y B, los resultados de las pruebas para 
demostrar un efecto principal causado por A o B pueden no ser significativos. Lo 
anterior es cierto debido a que los dos factores pueden interaccionar en tal forma 
(direcciones opuestas) que los efectos se compensen para uno o am bos factores. Este 
proceso de compensacion puede evitar la deteccibn de efectos principales significati¬ 
vos con base en una comparacion entre las medias del nivel del factor. 

Para desarrollar el procedimiento del analisis de varianza, puede escribirse el 
modelo (12.21) en terminos de las desviaciones, al igual que en los casos previos. 

y,jk ~ M = (Mr ~ M> + (My - M) 

+ (Miy - M, - My + M) + (Liy ’k - M/y)» (12.22) 

en donde /x r . es la media real del /'-esimo nivel de A, H j. es la media real del y-esimo 
nivel de B y p ir es la media real del tratamiento (/, j). De esta forma, la igualdad dada 
por (12.22) establece que la desviacion de una observacion con respecto al promedio 
global esta formada por cuatro componentes: las desviaciones causadas por el efecto 
principal de A; por el efecto principal de B; por el efecto de interaccion entre Ay B, 
por el error aleatoric. 

Las observaciones de un factorial con dos factores en un experimento completa- 
mente aleatorizado pueden colocarse como se muestra en la tabla 12.13. De esta se 


TABLA 12.13 Arreglo comun de las observaciones para un disefto factorial con dos factores 
y n observaciones por tratamiento 




Nivel 1 



A 

Nivel i 



Nivel a 


Nivel 1 


- I'm* - 

• Y„n ■ • 

■ Y iU 

- Li* - 

• • 

■ Y all ■ 

"■ Liit ■■■ 

Y.,n 

B Nivel j 

Y\j\ ' 

- Y,j, - 


■ Y 0 , 

- Y itk - 

L/„ •• 

■ Y„j, • 

- Y ujk - 

Y», n 

Nivel b 

Ym ' 


' Y ]h „ 

• y m ■ 

- Y ibk - 

Y, b „ ■ ■ 

• Y .», • 

- L,m - 

Ya bn 
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definen las siguientes estadlsticas: 


bn an a b 

t, = 22 y iJk , T.j. = 22 T.k =22 y,jk. 

j= I *= I / = I A=1 i = l 7=1 

F,. = 7.,, = T.j./na, Y. k = T.Jab, 


T, r = 2 Y uk , Y, r = Tjj./n, 

k = I 

a b n 

t =22 2 y.jk, y = r. ..//w*. 

i=i j=i *=i 


Notese que T r (T. r ) es la suma de todas las observaciones en el /-esimo (/-esimo) ni- 
vel de A ( B) y T k es la suma de todas las observaciones en la Ar-esima repeticion. En 
forma similar, T ir es la suma de todas las observaciones en el tratamiento (/, j). Las 
definiciones correspondientes para las mediae de la muestra deben ser aparentes. 

A1 reemplazar los parametros en (12.12) con sus correspondientes estimadores, 
se tiene 

(Y iJk - y .) = (?,. - 7. ) + (Y.j. - 7 ) 

+ (Yr - Yi - 1,. + 1.) + (Y ijk - Y,j). 

Si se eleva al cuadrado la identidad con base en la muestra anterior y se suman sobre 
i, J y 7 todos los terminos que contienen productos cruzados se reducen a cero, y se 
tiene el siguiente resultado: 

22 2 (y, k - y f = ^ 2 (7. - 7 ) 2 + na 2 (7, - 7 ..? 

' j k 1 J 

+ n 2 2 (7y. - 7,. - Y.J. 4- 7...) 2 + 2 2 2 (Y uk - Yj.) 2 . (12.23) 

' j ' j k ( 

En otras palabras, la suma total de cuadrados se separa en las sumas de cuadrados 
debidas: al factor A (SCA), el factor B (SCB), a la interaccion entre A y B (SCAB) y 
a los errores (SCE). 

Tambien puede escribirse el modelo (12.21) en terminos de las desviaciones 
causadas por los tratamientos y el error aleatorio, es decir 

(Yijk - M) = (M„. - M) + (Fy* - AL,.)- (12.24) 

En esta forma, la desviacion debida a los tratamientos abarca los efectos debidos av4, 
B y la interaccion A B. Al sustituir en (12.24) las correspondientes estadlsticas, se 
tiene 


(Yijk - y ) = ( Y r - Y ) + (Yijk - Yj-), 
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las que, al elevarse al cuadrado y sumar sobre i, j y k, dan como resultado 

2 £ 2 iY V k - Y..y = n E 2 flv - y ) 2 + 2 2 2 (^* - V- 

i j k i j i j k 

O 

STC = SCTR -f SCE. (12.25) 

De (12.23) se desprende que 

SCTR = SCA + SCB + SCAB. (12.26) 

Puede demostrarse que, con base en (12.23), la descomposicion del numero de gra- 
dos de libertad es la siguiente: 

gl(STC) = gl(SCA) + gl(SCB) + gl(SCAB) + gl(SCE), 
o 

(nab — 1) = (a — 1) + (b - 1) + (a - 1 )(b - 1) + ab(n - 1). 

Para las suposiciones del modelo y la hipotesis de interes, SCA/cr : , SCB/cr 2 , 
SCAB/cr 2 , y SCE/ct 2 son variables aleatorias independientes chi-cuadrada con (a - 
1), ( b - 1), (a - 1) (b - 1) y ab (n - 1) grados de libertad, para cada una. De acuer- 
do con lo anterior, la estadlstica de prueba para los efectos principales y de interac- 
cion son los cocientes entre los cuadrados medios, correspondientes y cuadrado 
medio del error y tienen una distribucion F. Al igual que para los casos anteriores, 
una region critica de tamano a en el extremo superior de la regi 6 n es la apropiada 
para cada caso. Puede observarse que el resultado anterior sigue siendo valido al 
examinar los valores esperados de los cuadrados medios. Para el caso de efectos fi- 
jos, estos valores son los siguientes: 


E(CME) = o- 2 , 

, Eaj 

£(CMA) = a- 2 + nb - 7 , 

a — 1 

£(CMB) = o - 2 + na~ 
b - 1 


E(CMAB) 


S 2 (a/3) 2 
(a - 1 )(b - 1 ) 


Si no existe ninguna interaccion entre A y B (es decir, si (a/3), v = 0 para toda i y 
J), entonces CMAB y CME tienen el mismo valor esperado y los efectos son aditivos. 
Pero si el cociente CMAB/CME tiene un valor suficientemente grande, esto sugeri- 
ria una interaccion estadisticamente apreciable entre A y B y, por lo tanto, 
debe rechazarse la hipotesis nula. De manera similar si a, = 0 para toda i, CMA y 
CME tienen valores esperados iguales y no existe un efecto principal causado por A. 
Pero un cociente grande entre CMA y CME tiende a implicar aue el efecto principal 
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atribuible a A es estadisticamente significative*. El mismo argumento es v&lido para 
el efecto principal de B. 

En la tabla 12.14 se encuentra un resumen del analisis de varianza para un diseflo 
factorial con dos factores. Aunque en la tabla se proporcionan formulas de calculo 
para cada fuente de variacion, la practica usual para realizarlos a mano es calcular 
SCT mediante la formula que aparece en la tabla 12.14 y SCTR de la formula 


SCTR = - 2) 2 Tl 

n - j 


T 2 

nab 


Entonces puede obtenerse SCE al emplear (12.25). A su vez, mediante el empleo de 
las fbrmulas que aparecen en la tabla 12.14 se calculan SCA y SCB, y se obtiene 
SCAB con base en (12.26). 


Ejemplo 12.5 Se llev6 a cabo una investigacibn para determinar si pueden en- 
contrarse diferencias apreciables en los salarios iniciales para contadores graduados 
con base en el sexo, localidad del lugar de trabajo o la interaction de los dos. El estu- 
dio se llevo a cabo en grandes ciudades del noroeste, el oeste medio y el oeste. Se 
piensa que sera suficiente un arreglo factorial en un diseflo completamente aleatori- 
zado. Se decide emplear los salarios iniciales de cuatro personas para cada una de las 
seis combinaciones de tratamientos. Para asegurar que las unidades experimentales 
son homogeneas, se seleccionaron personas con antecedentes muy similares en la 
medida de lo posible. Tienen la misma edad y el mismo promedio de calificaciones 
durante sus estudios; ninguno tenia experiencia profesional y todos se graduaron en 


TABLA 12.14 Tabla ANOVA para un experimento factorial con dos factores completamen- 
te aleatorizados 


Fuente de 


variacion 

gl 

sc 


CM 

Estadistica F 

Factor A 

a - 1 


T 2 

noh 

SCA /(« - 1) 

CMA/CME 

Factor B 

h - 1 

— X T\ 

no , 

T~ 

nab 

SCB /|h - 1) 

CMB/CME 



-im 

n , , 

— V 7- 
nh , 



Interaccion AB 

1 tl lit h II 

- — V T : 
no , 

1- 

nab 

SCAB/In IK b 

- 1; CMAB/CME 

Error 

a bln 1) 

X V X ru - 

i , k 

l V V T- 
n t r 1 

SCE UthUi ■ 1) 


Total 

nub - l 

111 YU 

i i k 

T 1 
nob 
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TABLA 12.15 Salarios iniciaies para contadores graduados (miles de dolares) 



Noroeste 

Oeste medio 

Oeste 

Totales 

Mujeres 

15.2 


14.9 

16.2 



16.8 


16.2 

15.9 



15.5 


15.6 

16.8 



14.9 


15.3 

15.8 



Tu- = 62.4 

T 2 y = 

62.0 

T„ = 64.7 

Ty = 189.1 

Hombres 

18.1 


17.8 

18.4 



16.3 


18.2 

16.8 



17.2 


18.1 

17.5 



17.9 


17.6 

18.7 



T n = 69.5 

T 22 . = 

71.7 

Tn = 71.4 

T 2 . = 212.6 

Totales 

Ty. = 131.9 

Ti = 

133.7 

Ty. = 136.1 

T... 401.7 


universidades del mismo nivel academico. Con base en la informacion de la muestra 
proporcionada en la tabla 12.15, determinense cuales efectos son estadisticamente 
apreciables. 


Las sumas de interes aparecen en la tabla. Entonces 

401.7 2 


STC = 15.2 + 16.8 + ••• + 18.7 2 


24 


SCTR 


62.4 2 4- 69.5 2 + ••• 4- 71.4 2 401.7 2 


4 24 

SCE = 32.8563 - 24.7838 = 8.0725. 

De manera similar, 


32.8563, 

24.7838, 


SC(SEX) = 


189.1 2 + 212.6 2 401.7 2 


12 


24 


= 23.0104, 


SC,LOO . + + 13611 - ^ - Ml. 

De esta forma 

SC(LOC x SEX) = 24.7838 - 23.0104 - 1.11 = 0.6634. 


La tabla del analisis de varianza se encuentra en la tabla 12.16. Con base en esta 
informacion, puede concluirse que el unico efecto discernible estadisticamente en el 
salario inicial se debe al sexo del graduado. 

Debe notarse que el metodo de Scheffe para comparar las medias del nivel del 
factor se extiende, en forma directa, a experimentos factoriales. Tambien puede 
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TABLA 12.16 Tabla ANOVA para el ejemplo 12.5 


Fuente de 
variation 

gl 

SC 

CM 

Valor F 

Localidad 

2 

1.11 

0.555 

1.24 

Sexo , 

1 

23.0104 

23.0104 

51.31 

Localidad x sexo 

2 

0.6634 

0.3317 

0.74 

Error 

18 

8.0725 

0.4485 


Total 

23 

32.8563 

fa. 99 , i, is — 8.29; /o.w. 2 , is — 6.0 


efectuarse un analisis de residuos para los niveles de cada factor para verificar, entre 
otras cosas, la hipotesis de varianzas iguales. Los residuos se obtienen mediante el 
empleo de la relation 


€ijk yijk y,j- 

En los casos que se han examinado hasta este momento, siempre se empleo el 
cuadrado medio del error como el denominador del cociente F. Sin embargo, para 
experimentos estadisticos que incluyen dos o mas factores, lo anterior no siempre es 
valido. La estadistica F apropiada para un analisis de varianza depende, en forma 
directa, de las esperanzas de los cuadrados medios de las fuentes de variacibn, las 
que a su vez dependen de si se consideran a los efectos correspondientes como fijos 
o aleatorios. 

Para experimentos factorials con dos factores surgen tres situaciones distintas: 
a) los niveles de ambos factores son de efectos fijos; b) los niveles de ambos factores 
son de efectos aleatorios, o c) los niveles de un factor son de efectos fijos mientras 
que los del otro son de efectos aleatorios. Ya se ha analizado la primera posiblidad. 
Para las otras dos, los valores esperados de los cuadrados medios tanto para el mo- 
delo de efectos aleatorios como para el modelo de efectos mixtos se proporcionan en 
la tabla 12.17. 


TABLA 12.17 Esperanzas de cuadrados medios para un factorial con dos factores: modelos 
de efectos aleatorios o de efectos mixtos 


Efectos aleatorios (A y B aleatorios) 


Fuente 


ECM 


Estadistica F 


Efectos mixtos (A fijo, B aleatorio) 


ECM 


Estadistica F 


A a- + nu + nbo~ a CMA/CMAB 

B cr : + ntrip + naa'p CMB/CMAB 

AB o-- + no-ip CMAB/CME 

Error <r : 


2 , 2 i , 

<x + no a p + nb - -- 

(a - 1 ) 


cr + nao'p 
o 1 + nolp 
a 2 


CMA/CMAB 

CMB/CME 

CMAB/CME 
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Con base en el material de este capitulo, el procedimiento que se ha empleado 
para construir la estadistica de prueba es comparar dos cuadrados medios que, bajo 
la hipritesis nula, tengan el mismo valor esperado, y bajo la hipdtesis altemativa, el 
cuadrado medio del numerador tenga un valor esperado mucho m&s grande que 
el del denominador correspondiente. Si la hipdtesis nula es cierta, la estadistica tiene 
una distribucidn F con un numero apropiado de grados de libertad. Con esto en 
mente, los cocientes de cuadrados medios indicados en la tabla 12.17 deben ser ya 
evidentes. Por ejemplo, considerese el caso de efectos aleatorios y, en particular, la 
hipdtesis nula de que no existe variacion alguna entre todos los posibles niveles de A; 
estoes , H 0 : cr 2 = 0. Si //„ es cierta, entonces E(CMA) = or 2 + ncr 2 ap , donde cr 2 ^ 
denota la varianza causada por la interaccidn entre Ay B. Pero este valor esperado 
es el mismo solo para E (CMAB) y no para E (CME) bajo H 0 . Por otro lado, si 
H 0 es falsa, E ( CMA ) es mayor que E {CMAB). De acuerdo con lo anterior, la 
estadistica de prueba apropiada para H 0 es CMA/CMAB. 

Debe recordarse que en experimentos factoriales, el cuadrado medio del error 
sera el denominador en el cociente de cuadrados medios para todos los efectos princi- 
pales y de interaccidn, solo si los niveles de todos los factores son dc efectos fijos. De 
esta forma, en la fase de disefto de un experimento estadistico es muy importante la 
seleccion de los niveles del factor, ya que tienen una influencia directa en el analisis. 
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Ejercicios 

12.1. Suponga que se asigna al lector la responsabilidad de investigar en una fabrica el efecto 
que pueden tener diferentes cambios en la semana de 40 horas de trabajo, sobre la pro- 
ductividad promedio en una gran fabrica. En forma especifica, se desean comparar 
cinco dias a la semana, 4 dias a la semana y 3'/3-dias a la semana. Describa con gran de- 
talle su propuesta de diseno estadistico. Asegurese de identificar los tratamientos, las uni- 
dades e.xperimentales y otros factores importantes para llevar a cabo la investigacion. 

12.2. Las estadisticas para accidentes indican que alrededor de dos terceras partes de los ac- 
cidentes automovilisticos de consecuencias fatales en Estados Unidos son causados por 
conductores en estado de ebriedad. Supoga que usted es comisionado para investigar el 
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grado en el que el alcohol afecta la habilidad de las personas para desempeftar fun- 
ciones de rutina al conducir un automovil. Describase con gran detalle un diseflo esta- 
distico para lograr esta tarea e indiquese como debe llevarse a cabo este experimento. 

12.3. Una compafiia de seguros desea determinar si existen diferencias discemibles en el 
numero de dias promedio que los pacientes que padecen una misma enfermedad per- 
manecen en cuatro grandes hospitales de cierta area metropolitana. La compafiia tam- 
bien esta interesada en detectar cualquier efecto debido al sexo de los pacientes. 
Describase con detalle un diseflo estadistico para lograr este objetivo. Asegurese de 
identificar la naturaleza de cada factor, ya sea como de efecto fijo o aleatorio; escribase 
el modelo y establezcase la hipotesis por probar. 

12.4. Una operacion de llenado tiene tres maquinas identicas que se ajustan para vaciar una 
cantidad especifica de un producto en recipientes de igual tamaflo. Con el proposito de 
verificar la igualdad de las cantidades promedio vaciadas por cada maquina, se toman 
muestras aleatorias, en forma periodica, de cada una. Para un periodo particular, se 
observaron los da*os que aparecen en la tabla 12.18. 


TABLA 12.18 Datos de la muestra para el ejercicie 12.4 


A 

Maquina 

B 

C 

16 

18 

19 

15 

19 

20 

15 

19 

18 

14 

20 

20 


19 

19 


19 



a) Calculesey,, - y. y verifiquese que la suma de estas desviaciones para toda i yj es 
cero. 

b) Estimese r, para toda j, y verifiquese que la suma de Hjiy, - v ) sobre todas las j 
es cero. 

c) Calculese, en forma directa, cada una de las tres sumas de cuadrados dadas en la 
expresion 12.8 para verificar que STC = SCTR + SCE. 

d) iExisten algunas diferencias estadisticamente significativas en las cantidades pro¬ 
medio vaciadas por las tres maquinas? Empleese a = 0.05. 

12.5. En el ejercicio 12.4, supongase que se divide cada observation entre 10. Demuestrese si 
esta operacion tiene algun efecto con las respuestas a las partes c y d. 

12.6. Para el ejercicio 12.4, construyanse constrastes a su election y empleese el metodo de 
Scheffe para determinar si estos son estadisticamente significativos. 

12.7. Se pide a un laboratorio de prueba independiente que compare la durabilidad de 
cuatro diferentes marcas de pelotas de golf. El laboratorio propone un experimento en 
el que se seleceionan, en forma aleatoria ocho pelotas por cada fabrieante y se ponen 
en una maquina que golpea cada pelota con una fuerza constante. La medicion de inte- 
res es el numero de veces que la maquina golpea la pelota antes de que su recubrimien- 
to externo se rompa. En la tabla 12.19 se encuentra la informacion que se obtuvo al lle- 
var a cabo el experimento. 
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TABLA 12.19 Datos de la muestra para el ejercicio 12.7 


A 

B 

Marca 

C 

D 

205 

242 


237 

212 

229 

253 


259 

244 

238 

226 


265. 

229 

214 

219 


229 

272 

242 

251 


218 

255 

225 

212 


262 

233 

209 

224 


242 

224 

204 

247 


234 

245 


a) i,Existe alguna razon para creer que la durabilidad promedio es diferente para 
cada una de las cuatro mareas? Usese a = 0.05. 

b) iExiste alguna razon p" r a ^’idar de la suposicion de que las varianzas de los errores 
son iguales? 

12.8. Para determinar si existen diferencias en la cosecha promedio de tres variedades de 
maiz, se dividio en tres partes iguales un area para siembra. A su vez, cada una de estas 
partes se subdivide en otras cinco iguales entre si, y se siembra cada una con una va- 
riedad de maiz. En el momento de la cosecha, la medicion de interes es el numero de 
toneladas por acre. La tabla 12.20 es una tabla de analisis de varianza incompleta para 
este problema. 


TABLA 12.20. Tabla parcial ANOVA para el ejercicio 12.8 


Fuente 

gl 

SC 

CM 

Valor F 

Tratamientos 


64 



Error 





Total 


100 




a) Escribase el modelo para este problema. 

b) iSe esta satisfecho con las suposiciones? Hagase un comentario. 

c) Establezcase la hipotesis nula por probar. 

d) Completese la tabla ANOVA y determinese si puede rechazarse la hipotesis nula 
para un nivel a = 0.01. 

12.9. Se desea determinar si la cantidad de carbon empleado en la fabrication de acero 
tiene algun efecto en la resistencia a la tension de este. Se investigaron cinco diferentes 
porcentajes de carbon: 0.2, 0.3, 0.4, 0.5 y 0.6%. Para cada porcentaje de carbdn se 
seleccionaron, en forma aleatoria del mismo lote, cinco muestras de acero y se mi- 
dieron las resistencias a la tension. Se obtuvo la informacion que se muestra en la tabla 
12.21, donde la tension se encuentra en kilogramos por centimetro cuadrado. 

a) Con base en esta informacion, determinese si el porcentaje de carbon tiene un 
efecto estadisticamente significativo sobre la resistencia a la tension del acero. Usese 
a = 0.01. 

b) Si la respuesta a la parte a es afirmativa,proponganse los contrastes relevantes y 
pruebese su significancia estadistica. 
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TABLA 12.21 Datos de la muestra para el ejercicio 12.9 


0.2% 

0.3% 

Contenido de carbdn 
0.4% 

0.5% 

0.6% 

1240 

1420 

1480 

1610 

1700 

1350 

1510 

1470 

1590 

1790 

1390 > 

1410 

1520 

1580 

1740 

1280 

1530 

1540 

1630 

1810 

1320 

1470 

1510 

1560 

1730 


12.10. En el ejercicio 12.9, iexiste alguna razon para dudar de la suposicion de varianzas 
iguales? 

12.11. Se selecciono una muestra al azar de un numero de presidentes de compaflias, en 
cuatro diferentes areas geograficas de Estados Unidos, con el proposito de determinar 
si el area tiene algun efecto sobre los ingresos anuales de estos altos ejecutivos. Se ob- 
servaron los salarios anuales que se muestran en la tabla 12.22. Con la information 
uada, proporcionese un argumento, ya sea en contra o a favor, de si debe utilizarse la 
tecnica del analisis de varianza para determinar si el area tiene algun efecto sobre el 
ingreso anual. Tratese de dar un apoyo sustancial en cualquiera de los dos casos. 


TABLA 12.22 Datos de la muestra para el ejercicio 12.11 (miles de dolares) 


Noreste 

Area 

Oeste medio 

Sureste 

Oeste 

140 

93 

78 

85 

125 

135 

112 

72 

95 

68 

57 

97 

110 

53 

97 

105 

59 

115 

52 

62 


12.12. En una planta industrial se desea determinar si diferentes trabajadores con el mismo 
nivel de habilidad tienen algun efecto sobre el numero de unidades que se espera que 
produzcan durante un periodo ftjo. Se lleva a cabo un experimento en el que se selec- 
cionan al azar cinco trabajadores y se observa el numero de unidades que cada uno 
produce en seis periodos con la misma duration, produciendose los resultados que se 
encuentran en la tabla 12.23. 


TABLA 12.23 Datos de la muestra para el ejercicio 12.12 


1 

2 

Trabajador 

3 

4 

5 

45 

52 

39 

57 

48 

Al 

55 

37 

49 

44 

43 

58 

46 

52 

55 

48 

49 

45 

50 

53 

50 

Al 

42 

48 

49 

44 

57 

41 

55 

52 
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a) Escribase el modelo para este problema y expliquese cada termino. 

b) Establezcase la hipotesis nula por probar. 

c) Determinese si puede rechazarse la hipotesis nula para un nivel a = 0.05. 

d ) iQue fraction de la varianza en el numero de unidades producidas es atribuible a di- 
ferencias entre los trabajadores? 

12.13. Desde el incremento en los precios de la gasolina se han desarrollado varios dispositi- 
vos, los cuales se colocan en los carburadores de los automdviles, con el prop6sito de 
aumentar el rendimiento de estos. Una empresa selecciona tres de los dispositivos mas 
populares para someterlos a prueba. La empresa desea compararlos con los carburado¬ 
res estandar, con el propbsito de determinar si existe un incremento apreciable de 
millas por galon de gasolina con el uso de estos dispositivos. La compafiia selecciona 
cinco tipos de automoviles para el experimento. Para controlar la variacion, se planea 
utilizar el mismo conductor para todo el experimento. 


TABLA 12.24 Datos de la muestra para el ejercicio 12.13 (millas por galon) 


Automovil 

Carburador 

estandar 

Dispositivo A 

Dispositivo B 

Dispositivo C 

1 

18.2 

18.9 

19.1 

20.4 

2 

21A 

27.9 

28.1 

29.9 

3 

35.2 

34.9 

35.8 

38.2 

4 

14.8 

15.2 

14.9 

17.3 

5 

25.4 

24.8 

25.6 

26.9 


a) H&gase un bosquejo del plan especifico para realizar este experimento. 

b) Supongase que se observan los datos que se encuentran en la tabla 12.24. Escribase 
el modelo y establezcase la hipotesis nula por probar. iPuede rechazarse la hipotesis 
nula para un nivel a = 0.05. 

c) Si se rechaza la hipotesis nula de la parte b, construyanse por lo menos dos contras- 
tes relevantes y pruebese su significancia estadistica. 

12.14. En el ejercicio 12.13, supongase que no se ha considerado el automovil como una fuen- 
te viable de variacion en el rendimiento observado y muestrese si esta omision tiene al- 
gun efecto con la respuesta a la parte b. 

12.15. Los cigarrillos producen cantidades apreciables de monoxido de carbono. Cuando se 
inhala el humo del cigarrillo, el monoxido de carbono se combina con la hemoglobina 
para formar carboxihemoglobina. En un estudio reciente,* los investigadores deseaban 
determinar si una concentration apreciable de carboxihemoglobina reduce la toleran- 
cia al ejercicio en aquellos pacientes que sufren de bronquitis cronica y enfisema. Se se- 
leccionaron siete** de estos pacientes y, en un ambiente controlado, se les pidio que 
caminaran durante 12 minutos respirando una de las siguientes cuatro mezclas gaseo- 
sas: aire, oxigeno, aire mas monoxido de carbono (CO) u oxigeno mas monoxido de 
carbono. La cantidad de monoxido de carbono respirado fue suficiente para elevar la 
concentration de carboxihemoglobina de cada sujeto en 9%. Para controlar el consu- 
mo de monoxido de carbono, se pidio a los siete fumadores que dejaran de fumar 12 

*P. M. A. 'Calverly, R. J. E. Leggett, anil D. C. Flenley, Carbon monoxide and exercise tolerance 
in chronic bronchitis and emphysema, Brit. Med. J. 283 (1981), 877-880. 

** El estudio completo se llevo a cabo con 15 sujetos. 
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horas antes del experimento. Los datos que figuran el la tabla 12.25 representan las dis- 
tancias caminadas por los sujetos en 12 minutos para cada condition. 


TABLA 12.25 Datos de la muestra para el ejercicio 12.15 (en litros) 


Sujeto 

A ire 

Mezcla gaseosa 

Oxigeno Aire + CO 

Oxigeno + CO 

1 

835 

874 

750 

854 

2 

787 

827 

755 

829 

3 

724 

738 

698 

726 

4 

336 

378 

210 

279 

5 

252 

315 

168 

336 

6 

560 

672 

558 

642 

7 

336 

341 

260 

336 


a) Escribase el modelo para este problema. 

b) iPuede rechazarse la hipotesis nula de que no existe algun efecto, debido a la 
mezcla de gas, en la distancia caminada durante el lapso de 12 minutos para un 
nivel de a = 0.05 ? 

c) Llevese a cabo una prueba Fconservadora para la hipotesis nula. <,Es la conclusion 
diferente a la de la parte b7 

d) Si la respuesta a la parte b es si, construyanse los contrastes pertinentes y empleese 
el metodo de Scheffe para determinar si estos son estadisticamente significativos. 

12.16. Se desea determinar si existen diferencias apreciables en los precios promedio entre 
cuatro grandes supermercados en una ciudad dada. De los articulos de la misma marca 
que se venden con regularidad, se seleccionan al azar 10 y se observan sus precios uni- 
tarios en cada sup»ermercado. Se obtiene la information que figura en la tabla 12.26. 

a) Escribase el modelo para este problema. 

b) Establezcase una hipotesis nula apropiada y determinese si esta puede rechazarse 
para un nivel de a = 0.01. 

c) Determinense todos los residuos y hagase la grafica de estos para cada tratamiento y 
para cada bloque. Hagase un comentario sobre sus resultados. 


TABLA 12.26 Datos de la muestra para el ejercicio 12.16 (en dolares) 


Articulo 

A 

Supermercado 

B C 

D 

I 

3.29 

3.42 

3.27 

3.35 

2 

0.59 

0.65 

0.59 

0.60 

3 

1.25 

1.29 

1.25 

1.27 

4 

4.35 

4.59 

4.29 

4.49 

5 

0.89 

0.95 

0.89 

0.89 

6 

1.85 

1.79 

1.89 

1.89 

7 

0.95 

0.89 

0.89 

0.90 

8 

0.75 

0.79 

0.69 

0.79 

9 

2.35 

2.35 

2.39 

2.39 

10 

1 49 

1.55 

1.55 

1.49 


12.17. En el ejemplo que sirvio como introduction en la section 12.6, supongase que se selec¬ 
cionan en forma aleatoria 12 componentes del mismo lote y en grupos de tres se asig- 


www. FreeLibros. com 


Ejercicios 441 


nan a las cuatro combinaciones de homos y temperaturas. Los tiempos de duracion de 
los componentes se encuentran en la tabla 12.27. 


TABLA 12.27 Datos de la muestra para d 
ejercicio 12.17 (en horas) 



o, 

O, 

T, 

6.29 

5.95 


6.38 

6.05 


6.25 

5.89 

Ti 

5.80 

6.32 


5.92 

6.44 


5.78 

6.29 


a) Escribase el modelo apropiado para este problema. 

b) Establezcase la hipotesis por probar. 

c) Determinese la tabla del analisis de varianza y obtenganse conclusiones apropiadas. 
Empleese a = 0.05. 

12.18. En el ejercicio 12.3, supongase que se obtuvo la information proporcionada en la tabla 
12.28 para pacientes seleccionados al azar, que padecen la misma enfermedad. 

TABLA 12.28 Datos de la muestra para el ejercicio 12.18. Duracion de la hospitalization en dias en 
cuatro hospitales. 



Hospital A 

Hospital B 

Hospital C 

Hospital D 

Hombres 

7 

9 

10 

6 


10 

9 

8 

7 


8 

12 

12 

6 


11 

14 

13 

9 

Mujeres 

9 

11 

13 

8 


12 

12 

11 

9 


12 

14 

14 

8 


11 

13 

14 

10 


a ) Determinese que efectos son estadisticamente discernibles a un nivel de a = 0.01. 

b) Determinense todos los residuos y hagase la grafica de estos para cada hospital. 
iQue conclusion puede dar? 

12.19. El objetivo de un experimento de agricultura fue determinar si existian diferencias apre- 
ciables en la cantidad de trigo cosechado, de entre cuatro variedades y tres tipos de fer- 
tilizantes. Para el experimento se encontro una area muy grande de siembra en la que 
las condiciones del suelo eran, practicamente, homogeneas. El area fue dividida en 12 
zonas de igual tamaflo para las 12 combinaciones de variedad de trigo y tipo de fertili- 
zante. Para medir el error experimental, cada zona se dividio a su vez en cuatro y cada 
una de estas recibio el mismo tratamiento. Las tres'clases de fertilizante se selecciona- 
ron, en forma aleatoria, de entre un numero relativamente grande de fertilizantes, pero 
el interes no se extendio mas alia de las cuatro variedades de trigo seleccionadas para el 
experimento. En el momento de la cosecha se observaron los datos que aparecen en la 
tabla 12.29. 
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TABLA 12.29 Datos de la muestra para el ejercicio 12.19 
(toneladas por acre) 


Fertilizante 

A 

Variedad de trigo 

B C 

D 

1 

35 

45 

24 

55 

1 

26 

39 

23 

48 


38 

39 

36 

39 


20 

43 

29 

49 

2 

55 

64 

58 

68 


44 

57 

74 

61 


68 

62 

49 

60 


64 

61 

69 

75 

3 

97 

93 

89 

82 


89 

91 

98 

78 


92 

82 

85 

89 


99 

98 

87 

92 


a) Escribase el modelo apropiado para este problema. 

b) Establezcase la hipotesis nula por probar. 

c) Determlnese la tabla de analisis de varianza y obtenganse las conclusiones apro- 
piadas. Usese a = 0.05. 

12.20. En el ejercicio 12.19, iComo puede cambiar la respuesta a la parte c, si 

a) iSe supone que las variedades son de efectos aleatorios, y los tipos de fertilizante 
son de efectos fijos? 

b) iSe supone que ambos son de efectos fijos? 

c) iSe supone que ambos son de efectos aleatorios? 
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CAPITULO TRECE 

Analisis de regresion: 
el modelo lineal simple 


13.1 Introduccion 

En el capitulo anterior se desarrollaron los criterios basicos para el diseflo estadistico 
de experimentos. En este capitulo se examinaran las asociaciones cuantitativas entre 
un numero de variables, lo que en la terminologiaestadistica se conoce como analisis 
de regresion. 

Aunque en muchas disciplinas se estan rea liz ando experimentos diseflados en 
forma estadistica, la precision en la comparacion que en forma general se requiere, 
evita el empleo de estos diseftos en muchas situaciones. Investigar el efecto simulta- 
neo de varios factores con base en las tecnicas del analisis de varianza requiere de la 
suposicion de que los datos se han colectado en arreglos balanceados y que se lleva- 
ron a efecto los procedimientos de aleatorizacion adecuados. En forma obvia, lo an¬ 
terior es deseable si puede cumplirse, pero muchas veces es impractico. En realidad, 
a lo que en general se enfrenta el experimento es a un conjunto de datos que de mane- 
ra comun, no espera que hayan sido observados bajo condiciones estrictamente con- 
troladas y los que, salvo en ciertas ocasiones, no contienen ninguna replica real que 
permita una estimation apropiada del error experimental. Bajo estas condiciones, 
los metodos mas apropiados son el de minimos cuadrados y el analisis de regresion, 
y no los del analisis de varianza. 

El proposito de este capitulo radica en proporcionar los conceptos y metodologia 
basicos para extraer de grandes cantidades de datos las caracteristicas principales de 
una relation que no es evidente. De manera especifica, se examinaran tecnicas que 
permitan ajustar una ecuacion de algun tipo al conjunto de datos dado, con el pro¬ 
posito de obtener una ecuacion empirica de prediccion razonablemente precisa y que 
proporcione un modelo teorico que no esta disponible. Se supondra la existencia de 
un conjunto de n mediciones y,, y 2 , ..., y n de una variable respuesta Y, las cuales 
se han observado bajo un conjunto de condiciones experimentales fjc, , x 2 , ..., **) 
que representan los valores de k variables de prediccion. El interes recae en determi- 
nar una funcion matematica sencilla, por ejemplo un polinomio que describa, en 
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forma razonable, el comportamiento de la variable respuesta, dados los valores de 
las variables de prediction. Notese que la ecuacion que se obtiene por esta forma 
puede tener algunas limitaciones con respecto a su interpretation fisica; sin embar¬ 
go, en un medio empirico, sera muy util si puede proporcionar una adecuada capati- 
dad de prediction para la respuesta en el interior de una region espetificada de las 
variables de prediction. 

A pesar de que no se encuentra problema aiguno con las designaciones comunes de 
variable dependiente e independiente para Yyx, respectivamente, se preferira deno- 
minarlas como variable de respuesta y de prediccion, ya que en la regresion solo 
puede asociarse un valor de Y con uno de prediccion x; no es posible establecer una 
relation causa-efecto entre la Y y las x. Algunos ejemplos proporcionaran una idea 
del por que obtener una relation causa-efecto se encuentra mas alia del alcance del 
analisis de regresion. De manera obvia, existe una relation entre la altura y el peso 
de los seres humanos, pero iimplica esta relation, por ejemplo, que pueda cambiar 
la altura de una persona si se modifica su peso? Tainbien se tiene una relation entre la 
cantidad de gas bruto que se consume en cierta area de alguna ciudad y la tem- 
peratura atmosferica promedio, pero ^significa esto que es posible aumentar la 
temperatura mediante la reduction del consumo de gas? Tambien puede existir algu¬ 
na relation entre un factor economico en particular y un ciclo financiero, pero 
iimplica lo anterior que el factor economico “causa” el ciclo financiero? 

La esencia de los ejemplos anteriores esta en el hecho de que el analisis de regre¬ 
sion solo descubre una asociacion entre la variable de respuesta y las variables de 
prediccion, en lugar de detectar una relation causa-efecto. La causalidad implica 
que un cambio en las x causara uno correspondiente en la variable respuesta. Por 
ejemplo, cuando se calienta un metal este se expande; en este caso no existe ninguna 
duda de que establecer una relation causa-efecto es muy importante. Pero en forma 
desafortunada, lo anterior generalmente no puede llevarse a cabo con base en un 
analisis estadistico, a menos que se efectue un experimento rigurosamente controla- 
do. Un ejemplo de lo anterior, es la relation que existe entre fumar y el cancer pul- 
monar. La evidencia que se tiene resulta abrumadora con respecto a que el fumador 
cronico (prediccion) esta estadisticamente ascociado con una alta incidencia de can¬ 
cer pulmonar (respuesta). La industria cigarrera argumenta, en contra de estos 
hallazgos, que todavia no existe una relation de tipo causal entre fumar mucho y la 
incidencia de cancer pulmonar. 

El enfoque que se utilizara en este capitulo, asi como en el siguiente, se limitara a 
establecer el grado de asociacion que existe entre variables, sin tomar en cuenta la 
notion de causalidad. En este capitulo se examinaran los fundamentos del analisis 
de regresion para el modelo con una sola variable de prediccion. En el capitulo 14 se 
estudiara lo que se conoce como el modelo lineal general en el que se supone que una 
respuesta dada es una funcion de varias variables de prediccion. 


13.2 El significado de la regresion y suposiciones basicas 

Si los metodos de regresion son tan utiles en la practica, debe comprenderse su signi¬ 
ficado y las suposiciones bajo las cuales se han desarrollado. Las tecnicas de regre- 
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sion proporcionan medios legitimos a traves de los cuales pueden establecerse aso- 
ciaciones entre las variables de interes en las cuales la relation usual no es causal. La 
palabra “regresion” se uso por primera vez en este contexto por Francis Galton 
(1822-1911) en sus estudios biologicos sobre la herencia. En ellos se noto que las ca- 
racteristicas promedio de la siguiente generacion de un grupo en particular tendian a 
moverse en la direction de las caracteristicas promedio de la poblacidn general, mis 
que hacia las de la generacion previa de ese grupo. Esta tendencia fue referida como 
una regresion hacia la media de la poblacion. 

De manera basica, la regresion tiene dos significados: uno surge de la distribu¬ 
tion conjunta de probabilidad de dos variables aleatorias; el otro es empirico y nace 
de la necesidad de ajustar alguna funcion a un conjunto de datos. Para ilustrar el 
primer significado se tratara de predecir el salario anual de un profesionista dado 
el numero de afios que han transcurrido desde su graduacion. Sea X el numero de 
afios y Y el salario anual. Debe ser obvio que para un valor dado de x es imposible 
predecir, de manera exacta, el salario anual de una persona en particular. Sin embar¬ 
go, es posible predecir el salario promedio de todos aquellos individuos para los que 
el numero de afios x que han transcurrido desde su graduacion es el mismo. En otras 
palabras, para cada valor de x existe una distribucion de ingresos anuales y lo que 
se busca es la media de esa distribucion, dado x. La grafica de la media condicional 
E( K|.t) como una funcion de x recibe el nombre de curva de regresion de Y sobre X. 
De esta forma, si fix , >)es la funcion de densidad conjunta de probabilidad de Xy 
Y, y si fiy\x) es la funcion de densidad condicional de Y dado x, se define la curva 
de regresion como 

E(Y\x) = f yf(y\x)dy. 


Ejemplo 13.1 Considerese la funcion de densidad conjunta de probabilidad dada 
por 


fix , .v) 



0 < x < y < 1, 

para cualquier otro valor 


Obtengase la curva de regresion de Y sobre X. 


Dado que 


entonces 


y 


/(.v 1-0 = fix, y)/f x ix). 


fxl 0 



y) dy 



2xi 1 


. 0 , 


/(>' 1-0 


2.c 


2.r( I - .v) 


1 


1 - x 
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Por lo tanto, la curva de regresion es 

E(Y\x) = l (l - xr'ydy = (1 + x)/2, 

la cual es una linea recta con pendiente e intersection igual a 1/2. 

El segundo significado de la regresion es mucho mas practico que el primero. En 
el no se tienen los elementos necesarios para determinar la curva de regresidn tal 
como se hizo en el ejemplo 13.1. No obstante, dado un conjunto de datos, puede 
asumirse una forma funcional para la curva de regresion y entonces tratar de ajustar 
esta a los datos. En estas situaciones, la variable respuesta es una variable aleatoria 
cuyos valores se observan mediante la selection de los valores de las variables de pre¬ 
diction en un intervalo de interes. Por lo tanto, las variables de prediccion no se con- 
sideran como variables aleatorias, sino que estas son un conjunto de valores fijos 
que representan los puntos de observation para la variable respuesta. El modelo de 
regresion propuesto debe ser relativamente sencillo y debera contener pocos para- 
metros. Un procedimiento muy util para la seleccion initial cuando se tiene solo una 
variable de prediccion es graficar la variable respuesta contra la variable de predic¬ 
cion. Si esta grafica revela una tendencia lineal, debera suponerse un modelo de 
regresion lineal. Si es evidente alguna curvatura, debera suponerse un modelo 
cuadratico o de mayor grado para ajustarse a los datos. 

Una vez que se ha seleccionado el modelo, la siguiente tarea es la de obtener esti- 
maciones para los parametros que intervienen en el mismo. Una tecnica muy acepta- 
da para este proposito es el metodo de minimos cuadrados (MC). Este metodo en- 
cuentra las estimaciones para los parametros en la ecuacion seleccionada mediante la 
minimization de la suma de los cuadrados de las diferencias entre los valores obser- 
vados de la variable respuesta y de aquellos proporcionados por la ecuacion de pre¬ 
diccion. Estos valores se conocen como los estimadores por minimos cuadrados 
{EMC) de los parametros. Los estimadores por minimos cuadrados poseen ciertas 
propiedades deseables, pero para determinarlas es necesario formular las siguientes 
suposiciones: 

1. Se ha seleccionado la forma correcta de la ecuacion de regresion. Esto impli- 
ca que cualquier variabiiidad en la variable respuesta que no pueda explicarse me¬ 
diante el empleo de la ecuacion de regresion, se debe a un error aleatorio. Por 
ejemplo, se sabe que la distancia d que recorre un objeto en un tiempo t, esta dada 
por la siguiente relation 

d = (3 o + fi,t, 

donde /3| es la velocidad pro medio y /3 0 es la position del objeto para / = 0. Si no 
fuese posible medir d en forma precisa para un valor dado de t, pero se observo un 
valor 

y = d + e, 

donde e es el error aleatorio, se ha seleccionado la forma correcta de la ecuacion de 
regresion y el problema se reduce a estimar los valores de /3„ y/3, .Sin embargo, rara 
es la vez que el problema resulta ser tan sencillo. 
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Por ejemplo, si se tiene interes en predecir la cantidad de ozono que se encuentra 
en la estratosfera, como una funcion de los niveles de concentration de los constitu- 
yentes quimicos de esta en cierto momento del dia, la ecuacion por seleccionar sera, 
en primera instancia, una conjetura. El error no puede considerarse como puramen- 
te aleatorio ya que pueden existir variaciones sistematicas por causa de errores en el 
modelo. Algunos de los valores de la variable de respuesta proporcionados por la 
ecuacion de prediction estaran sesgados ya que las estimaciones de los parametros 
tambien se encuentran sesgadas. 

2. Los datos que se observan son comunes en el sentido en que constituyen una 
muestra representativa de un medio acerca del cual el investigador desea generalizar. 
Si el investigador sabe que los datos no son representativos, el comportamiento ge¬ 
neral del mecanismo puede encontrarse mas alia del alcance de los datos. 

3. Los valores observados de la variable respuesta no se encuentran estadistica- 
mente correlacionados. Se supone que cada valor observado esta constituido por un 
valoi re J y una componente aleatoria. La componente aleatoria consiste en una va¬ 
riable aleatoria no observable; entonces la covarianza entre cualesquiera dos observa¬ 
tions Yj y Yj, o entre los correspondientes errores aleatorios e, y £,, es cero para 
toda ± j. 

4. Para toda / = 1, 2 ...n, la media de e, es cero y la varianza de e, es cr 2 . Esta 
ultima recibe el nombre de varianza del error y, generalmente, no es conocida. 
Dado que las variables de prediction no son variables aleatorias, la varianza de Y ( 
tambien es cr 2 para toda / y de esta forma es independiente del punto de observa¬ 
tion. Si no es posible formular la suposicion de que la varianza es constante para las 
observations de la variable respuesta, generalmente se emplea el metodo de mini- 
mos cuadrados con factores de peso. Este tema se estudiara con cierto detalle en el 
capitulo 14. 

5. Los puntos de observation o los valores de las variables de prediction son 
fijos o se seleccionan con anticipation y se miden sin error. Para muchas situaciones 
practicas, ambas condiciones no se cumplen. Afortunadamente, el metodo de mini- 
mos cuadrados sigue siendo valido siempre y cuando los errores en los valores de las 
x sean pequeflos al compararse con los errores aleatorios y dado que estos no depen- 
dan de los parametros del modelo. 

A manera de comentario final sobre las suposiciones del procedimiento MC, se 
consideraran solo minimos cuadrados lineales, donde la palabra “lineal” significa 
que el modelo seleccionado es lineal en los parametros. La frase “lineal en los para¬ 
metros” significa que ningun parametro en el modelo aparece como un exponente o 
es multiplicado por o dividido entre cualquier otro parametro. Por ejemplo, los mo- 
delos 


Y = Po + 0i* + e, 

Y = 1 3 0 + fi\X + /S 2 jr‘ + e, 

Y - /3 0 + /3,ln(x) + e, 

Y = /3 0 + /3,X, + f3 2 *2 + + e 

www. FreeLibros. com 


448 Analisis de regresion: el modelo lineal simple 


son lineales en los parametros /3 0 , /3,, /3 2 , y /3 3 , pero el modelo 

Y = /3 0 exp ip,x) + e 


no lo es debido a que el parametro /9| aparece como un exponente. 


13.3 Estimacion por minimos cuadrados para el modelo lineal simple 

En esta section se estudiara la estimacion por minimos cuadrados para el modelo li¬ 
neal simple en el que solo se tiene una variable de prediccion, y se supone una 
ecuacion de regresion lineal. Por ejemplo, los estudiantes universitarios que apren- 
den mas rapido tienen mejores calificaciones promedio (CP) y por lo tanto, mejores 
oportunidades de obtener buenos empleos despues de graduarse. Supongase que los 
dates q .5 se encuentran en la tabla 13.1 representan las calificaciones promedio de 
15 recien graduados y sus correspondientes salarios iniciales. 

Para este ejemplo, la variable respuesta es el salario initial y la variable de pre¬ 
diccion potencial es la calificacion promedio. Estas ultimas se seleccionaron de tal 
manera que reflejen un amplio intervalo. Se desea determinar una ecuacion de re¬ 
gresion para el salario inicial promedio como una funcion de la calificacion prome¬ 
dio. Dado que se ha propuesto solo una variable de prediccion, graficar los datos 
puede ser util en la selection inicial de un modelo de regresion. La grafica de los sala¬ 
rios iniciales contra las calificaciones promedio se muestra en la figura 13.1. Debe 
notarse que esta grafica fue realizada por un paquete estadistico para computadora 
conocido como “minitab”. Aunque no es tan sofisticado como SAS, Minitab es 
muy facil de usar y se recomienda para llevar a cabo analisis preliminares de regre¬ 
sion, entre otras aplicaciones. 


TABLA 13.1 Datos de la muestra para un 
modelo lineal simple (miles de dolares) 


CP Salario inicial 


2.95 

18.5 

3.20 

20.0 

3.40 

21.1 

3.60 

22.4 

3.20 

21.2 

2.85 

15.0 

3.10 

18.0 

2.85 

18.8 

3.05 

15.7 

2.70 

14.4 

2.75 

15.5 

3.10 

17.2 

3.15 

19.0 

2.95 

17.2 

2.75 

16.8 


www. FreeLibros. com 



13.3 Estimacidn por minimos Cuadrados para el modelo lineal simple 449 


24.0 + 


22.0 + 


* 


* * 


20.0 + 


2 

'E 

■§ 18-0 + 
a — 

C/5 


16.0 + 


14.0 + 

+ - 

2.60 


* 

* * 

* 




* 

* 

* 

* 

* 

* 


* 

2.80 

3.00 

-+- 

3.20 


Calificacion promedio 


— + — 
3.40 


— + 
3.60 


TABLA 13.1 Salario inicial contra calificacion promedio 


A pesar de que esta grafica muestra una gran dispersion,* se observa una tenden- 
cia lineal. De acuerdo con lo anterior se supondra un modelo de la forma 

Y, = /3„ + /3|.v, + e, r = 1.2. n, (13.1) 

donde K es la /-esima observacion de la variable respuesta, la cual corresponde al i- 
esimo valor x, de la variable de prediccion, e, es el error aleatorio no observable aso- 
ciado con Y, \ y y f3< son los parametros desconocidos que representan la inter- 
seccion y la pendiente, respectivamente. Laexpresion (13.1) se conoce como modelo 
lineal simple, debido a que es lineal en los parametros y se tiene solo una variable de 
prediccion. 

Cada observacion Y, es una variable aleatoria que es la suma de dos componen- 
tes; el termino no aleatorio A, + A-v,. y la componente aleatoria e, . Si e, fuera un 

* Por esta razon, este tipo de grafica se conoce como grafica de dispersion. 
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valor igual a cero, la observation L, se encontraria precisamente sobre la linea de re¬ 
gresion /3 0 + Por lo tanto, e, es la distancia vertical de la observation a la 
linea de regresion. Dado que se supone 


y 


entonces 


E(ej) = 0, Var(e ,) - cr 2 


i = 1,2. n. 


Cov(Ei,Ej) = 0 ify; 


£(K,) = E(& + + £ ,-) = /?„ + /3,x ; , 

Cov(Y h Yj) = a 2 i + j, 

y 

Var(K,) = Var(/3 0 + /3,jc, + e,) = Var(Bj) = r 2 . 

El ultimo resultado surge del hecho de que la varianza de una variable aleatoria 
no varia con respecto a la localization; en este caso, el corrimiento en localizacibn 
esta proporcionado por el termino no aleatorio J3 0 + /3,x r . Por lo tanto, enterminos 
reales, lo que se supone es que para cada calificacion promedio x existe una distribu¬ 
tion de probabilidad para los salarios initiales cuya media es una funcion lineal de x 
y cuya varianza es la misma para toda x. El modelo proporcionado por (13.1) debe 
considerarse solo como una selection initial para la forma funcional de la curva de 
regresion. Con base en analisis mas apropiados, los cuales se examinaran mas ade- 
lante, puede ser necesario hacer ajustes y estos a su vez pueden dar como resultado 
una ecuacion final de prediction diferente de la del modelo initial. 

Para obtener los estimadores de minimos cuadrados de /3 0 y /3,, se generalizara 
un conjunto de datos consistente en n pares (x,, y,), (x 2 , y 2 )> •••> ( x n, y n ), donde 
los valores de y son las observations de la variable aleatoria respuesta. El metodo 
de minimos cuadrados considera la desviacion de la observation Y, de su valor 
medio y determina los valores de /3 0 y /3, que minimizan la suma de los cuadrados 
de estas desviaciones. La /-esima desviacion o error es 

e, = Y- (f3 0 + f} lXi ), (13.2) 

y la suma de los cuadrados de los errores es 

n n 

2 e, 2 = 2 (L -/3 0 -/W- 03.3) 

,= i /= t 

Los estimadores de minimos cuadrados de /3 0 y >3, se obtienen mediante la diferen- 
ciacion de (13.3) con respecto a /3 0 y /3, y despues al igualar cada derivada parcial 
con cero, es decir 


ale, 2 

d/3 0 


-2S (Yi -Bo - B<x,) = 0, 
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—£-=-2'Zx i (Y i -B o -B l x i ) = 0, 
d(i\ 

donde B 0 y B, son los estimadores de minimos cuadrados* de /3 0 y /3,, respectiva- 
mente. A1 simplificar y distribuir las sumas en estas ecuaciones, se tiene 


Z y, = nB 0 + B, X xt 


Z XiY, = B 0 Z x t + E xj. 


(13.4) 


Las dos ecuaciones dadas por (13.4) se conocen como ecuaciones normales. 

Dadas las realizaciones y l: y 2 , ..., y „, las ecuaciones pueden resolverse para los 
estimados de minimos cuadrados b 0 y b { . Si se dividen umbos mienbros de la pri- 
mera ecuacion entre n, se obtiene 

- L . U 1X ‘. 

- - b 0 + b t -, 

n n 

entonces el estimador de minimos cuadrados de Bo es 


Z yt Z Xi 

bo = —-- b\ —— = y — b\X. 

n n 

A1 sustituir b 0 en la segunda ecuacion de (13.4) se obtiene 




la que, despues de resolver para b t , se reduce a 


(13.5) 


Z x ,y, - 


Z Xi) (Z yt 


,= 1 / \/=j 


Zx>- 


Z U, - jc)( y, - >’) 

;= i __ 

Z (x, - xy- 


(13.6) 


* Muchos autores prefieren designar a los estimadores de minimos cuadrados con letras cursivas minus- 
culas. para mantener la consistencia de la notation con respecto a los capitulos anteriores se designari al 
estimador de minimos cuadrados con una letra cursiva en mayuscula y el tipo en mimiscula para el esti- 
mado MC. 
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Los valores dados por (13.5) y (13.6) son aquellos que minimizan la suma de los cua- 
drados de los errores. 

Dados los estimadores de minimos cuadrados B 0 y B, para la interseccion y la 
pendiente, respectivamente, la recta de regresion estimada para el modelo (13.1) es 


Yj = B 0 + B, Xi (13.7) 

donde L, es el estimador para la media de la observation Y h la cual corresponde al 
valor Xj de la variable de prediccion. Notese que si se sustituye (13.5) por B 0 en 
(13.7) se obtiene una forma alternativa para la recta de regresion estimada, la cual 
se encuentra dada por 

Yj = Y — B t x + B\ Xi 

= T + B,(x t - x). (13.8) 

Con base en (13.2), la diferencia entre la realization >•, y el valor estimado y, es 
un estimador del correspondiente error. Este estimador se conoce como el /-esimo 
residual y se denota por 


De nuevo, notese que los residuos no son estimados en el sentido clasico de la esti¬ 
mation de parametros (fijos), sino que son estimadores de los valores de las varia¬ 
bles aleatorias no observables e, , los cuales se obtienen de la recta de regresion 
estimada. Los residuos e u e 2 , .... e„ son muy importantes debido a que proporcio- 
nan una abundante information sobre lo que puede faltar del modelo de regresion es¬ 
timado. Mas adelante se daran mas detalles con respecto a lo anterior. En este mo- 
mento se ilustraran los pesos de calculo para obtener la recta de regresion estimada para 
el modelo lineal simple empleando para ello los datos de los salarios. El proposito de 
esto radica en familiarizar al lector unicamente con el procedimiento de calculo. De lo 
contrario, se puede hacer uso de algun paquete estadistico para computadora. Posterior- 
mente, se presentara un listado de computadora para este ejemplo. 

En la tabla 13.2, se incluyen los calculos basicos necesarios para obtener los esti¬ 
madores de minimos cuadrados de la interseccibn y la pendiente. Las ultimas cuatro 
columnas de esta tabla no son necesarias para la determinacion de b {) y b x , estas se- 
ran empleadas despues en otro contexto. 

Mediante el empleo de (13.5) y (13.6) el estimador de minimos cuadrados para la 
pendiente es 



y el correspondiente estimado de minimos cuadrados para la interseccion es 


270.8 45.6 

—— - (8.12)— = - 6.63. 
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TABLA 13.2 Caiculos basicos para obtener los estimadores de minimos cuadrados b„ y b t 
(con base en los datos de salarios dados en la tabla 13.1) 


Salario Cuadrado del 


CP 

x, 

Salario 

y, 

x,y, 

y 

X'i 

y, 2 

estimado 

y, 

Residuo 

y, - y, 

residuo 
(y, - y,) 2 

2.95 

18.5 

54.575 

8.7025 

342.25 

17.32 

1.18 

1.3924 

3.20 

20.0 

64.000 

10.2400 

400.00 

19.35 

0.65 

0.4225 

3.40 

21.1 

71.740 

11.5600 

445.21 

20.98 

0.12 

0.0144 

3.60 

22.4 

80.640 

12.9600 

501.76 

22.60 

-0.20 

0.0400 

3.20 

21.2 

67.840 

10.2400 

449.44 

19.35 

1.85 

3.4225 

2.85 

15.0 

42.750 

8.1225 

225.00 

16.51 

-1.51 

2.2801 

3.10 

18.0 

55.800 

9.6100 

324.00 

18.54 

-0.54 

0.2916 

2.85 

18.8 

53.580 

8.1225 

353.44 

16.51 

2.29 

5.2441 

3.05 

15.7 

47.885 

9.3025 

246.49 

18.13 

-2.43 

5.9049 

2.70 

14.4 

38.880 

7.2900 

207.36 

15.29 

-0.89 

0.7921 

2.75 

15.5 

42.625 

7.5625 

240.25 

15.70 

-0.20 

0.0400 

3.10 

17.2 

53.320 

9.6100 

295.84 

18.54 

-1.34 

1.7956 

3.15 

19.0 

59.850 

9.9225 

361.00 

18.95 

0.05 

0.0025 

2.95 

17.2 

50.740 

8.7025 

295.84 

17.32 

-0.12 

0.0144 

2.75 

16.8 

46.200 

7.5625 

282.24 

15.70 

1.10 

1.2100 

Totales 45.6 

270.8 

830.425 

139.5100 

4970.12 

270.79 

0.01 

22.8671 


De acuerdo con lo anterior, la ecuacion estimada de regresion es 

y, = - 6.63 + 8.12 x,. (13.10) 

A1 intentar interpretar esta ecuacion se tiene que los valores y, son los estima¬ 
dores para las medias de las distribuciones de probabilidad de los salarios iniciales 
correspondientes a las calificaciones promedio x,. Tener una intersection negativa 
resulta fastidioso, ya que, por ejemplo, si x = 0.5, y = - 2.57, lo cual es absur- 
do. Pero las calificaciones promedio en este conjunto de datos varxan de 2.70 a 3.60, 
por lo tanto, cualquiera que sea la validez que tiene la ecuacion estimada de regresion 
al predecir los salarios iniciales promedio se mantiene, para todos aquellos valores de 
x que se encuentren entre 2.70 y 3.60. En la practica, muchas veces se desea predecir 
la respuesta mas alia del intervalo de valores de x para los cuales se obtuvo la 
ecuacion estimada de regresion. Si un valor de x se encuentra muy cercano a este in¬ 
tervalo, la prediction tendra cierta validez. De otra forma, esta debe verse con 
mucho cuidado, ya que la ecuacion de regresion estimada puede no ser apropiada 
para un intervalo de valores mas amplio de la variable de prediccion. 

La interpretation del valor estimado de la pendiente es directa. El incremento es- 
timado en el salario inicial promedio para cada aumento igual a una unidad de la ca- 
lificacion promedio es de 8 120 dolares. 

La tercera columna de la derecha en la tabla 13.2, contiene los salarios prome¬ 
dio estimados para cada calificacion promedio dada por (13.10). Por ejemplo, si 
x - 2.95, el salario inicial estimado promedio es y = -6.63 + 8.12(2.95) = (13.9). 
miles de dolares. Dado que el correspondiente valor observado es 18.5, de (13.9), 
e = 18.5 - 17.32 =1.18 es el residuo para x = 2.95. En otras palabras, el valor resi- 
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dual 1.18 es la distancia vertical que existe entre la observation 18.5 y el punto 
sobre la recta estimada de regresion para x = 2.95. Los otros residuos se obtienen de 
la misma manera y tienen significados similares. La figura 13.2 ilustra los residuos 
como distancias verticales desde la recta de regresion estimada. Dado que un residuo 
representa la cantidad en la que un valor estimado falla para predecir la media de la 
correspondiente observation aleatoria, entre mas grandes son las magnitudes de los 
residuos, mayor tendera a ser el efecto de la componente aleatoria en el modelo. 

Recuerdese que la varianza cr 2 de la variable respuesta es igual a la varianza del 
error y esta es constante para todos los valores de la variable de prediction. En gene¬ 
ral, dado que el valor de <r 2 no se conoce, puede obtenerse un estimador de este a 
partir de los estimados de minimos cuadrados b 0 y by. Dado que cada y, estima la 
media de Y iy la diferencia y, - y, representa la desviacion de Y, con respecto a su 
propia media. La suma de los cuadrados de estas diferentias, dividida entre una 
constante apropiada, es la forma en la que se determina una varianza. Pero estas di- 
ferencias son los residuos; pOi lo tanto, la suma de los cuadrados de los residuos di¬ 
vidida entre una constante apropiada es un estimador deer 2 . La constante apropiada 
es n - 2, ya que se pierden dos grados de libertad al tener que estimar los dos para- 
metros fi 0 y /3, antes de obtener y,-. El estimador de cr 2 se denota como s 2 y esta 
dado por 

n n 


E (y, - y ,-) 2 E 

/= i __ i=i 

n - 2 n - 2' 


(13.11) 



FIGURA 13.2 Residuos como distancias verticales desde la ecuacion estimada de regresion 
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El estimador s 2 recibe el nombre de varianza residual o CME, y la ralz cuadrada 
positiva s se conoce como la desviacion estandar residual. Para el ejemplo de los 
salarios iniciales, la varianza residual es s 2 = 22.8671/13 = 1.759. La varianza 
residual s 2 es una medida absoluta de que tan bien se ajusta la recta estimada de re¬ 
gresion a las medias de las observaciones de la variable respuesta. Por lo tanto, en 
general entre mas pequeflo sea el valor de.v 2 ,se ajustara mejor al modelo. Puede de- 
mostrarse que el estimador S 2 es un estimador no sesgado de a 2 con tal de que la . 
forma del modelo de regresion sea la correcta. De otra manera, S 2 estima cr 2 mas 
una componente que es el sesgo causado por un error en el modelo. 

Cuando se obtiene una recta de regresion por el metodo de minimos cuadrados, 
surgen cierto numero de propiedades. Algunas de estas son las siguientes: 

1. 2?., e, = 0. 

2. sr-.y, = 

3. Sf., x,e, = 0. 

Se demostrara la propiedad 1 y se dejan las correspondientes demostraciones de las 
propiedades restantes al lector. Debe notarse que la propiedad 2 se obtiene de la pri¬ 
mer ecuacion dada en (13.14) y la propiedad 3 de la segunda ecuacion normal. Para 
la propiedad 1, 


2^=2 (y.- - Pi) 

= 'Z(y i ~ b 0 - b t Xi) 

= 2 y> ~ nb 0 - b t 2. Xi 
= riy — n{y - b t x) - nb x x 
= 0. 

A causa de los errores de redondeo, la suma de los residuos dados en la tabla 13.2 
no es exactamente igual a cero. Ademas, dado que los estimadores MG se obtienen 
mediante la minimizacion de la suma de los cuadrados de los errores, para este 
ejemplo el valor minimo es 22.8671. 


13.4 Estimacion por maxima verosimilitud para 
el modelo lineal simple 

Puede emplearse el principio de maxima verosimilitud para estimar los parametros 
desconocidos en el modelo lineal simple dado por (13.1). Recuerdese que los estima¬ 
dores de minimos cuadrados se obtuvieron sin tener que especificar la distribucion 
de probabilidad de los errores aleatorios e,. Si se supone que los e, son variables 
aleatorias independientes, normalmente distribuidas, con media cero y varianza cr 
para toda i = 1. 2, n, es posible obtener los estimadores de maxima verosimi- 
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litud de /3 0 , A> y <x 2 ,es decir, si ademas de las suposiciones previas se especifica que 
Ei ~ MO, <r 2 ) paratoda i = 1, 2, n, entonces cada Y ( tambien se encuentra 
normalmente distribuida con media j8 0 + A-*t y varianza a 2 , dado que esta es una 
funcion lineal de una variable aleatoria con distribution normal. Los estimadores de 
maxima verosimilitud se obtienen mediante la maximization de la funcion de verosi- 
militud dada por • 


L(y,,y 2 , ...,y„;A>, A>or 2 ) = 


exp 

yl-rr a 


\_ 

2 a 


_2 (-Vi A A*i) 2 


yjlir a 

= (^ 5 ^) exp 


- 2^2 (y« ~ A ~ A xj 


2 a 


2 S (y.- - A ~ P< x i) 2 


donde 

ln[L(/3 0 , , cr 2 )] = - ~ ln(27r) - ^ ln(o- 2 ) - X (y, ~ A ~ 

2 2 2a 


A1 tomar las derivadas parciales con respecto a /6 0 , /8,, y cr 2 , y despues de igua- 
larlas a cero, puede demostrarse que los estimadores de maxima verosimilitud de 
/8 0 y /3, son identicos a los dados por (13.5) y (13.6), respectivamente, y el correspon- 
diente a a 2 esta dado por 


X hi - 9i) 2 

^ 2 / = I 

O’ = - 

AZ 


(13.12) 


El estimador de maxima verosimilitud de a 2 es sesgado pero, para valores grandes 
de n, la diferencia entre este y el estimador de minimos cuadrados no es importante. 

El lector puede sorprenderse del por que la necesidad de tratar con los estimado¬ 
res de maxima verosimilitud, si estos son iguales a los estimadores de minimos cua¬ 
drados. Una de estas razones es que los estimadores de maxima verosimilitud tienen 
propiedades deseables de consistencia, suficiencia y varianza minima. Ademas, estos 
proporcionan los medios necesarios para el desarrollo de criterios de inferencia para 

A. y A • 

La suposicion de que los errores se encuentran normalmente distribuidos es justi- 
ficable, debido a que la componente de error en el modelo es, en general, un efecto 
compuesto que representa muchas perturbaciones pequenas pero aleatorias, las 
cuales son independientes de la variable de prediccion y se deben a factores que no se 
encuentran incluidos en el modelo. En todo caso, las desviaciones de la suposicion de 
normalidad para valores grandes de n no son, en general, serias. 
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13.5 Propiedades generates de los estimadores de minimos cuadrados 

En esta section se desarrollaran algunas propiedades generales de los estimadores de 
minimos cuadrados, por lo que se consideraran algunos criterios que permitan la 
construction de intervalos de confianza y la realization de pruebas de hipotesis con 
respecto a los parametros de regresion A> y A • Asi mismo, se examinara la estima¬ 
tion de la respuesta media para una x dada y la prediction de una Y en particular 
para un valor dado de x. En gran medida, el enfoque de esta section sera de caracter 
teorico. 

Considerense los estimadores no sesgados de /?„ y A que son funciones lineales 

de las observaciones Y t , Y 2 . Y„. Si entre todos estos estimadores de A> y A 

existen algunos cuyas varianzas son mas pequeiias que las de todos los demas estima¬ 
dores no sesgados de A> y A, entonces estos son los mejores estimadores lineales no 
sesgados ( MELl ) de A> y A. El siguiente teorema conocido generalmente como teo- 
rema de Gauss- Markov, garantiza que los estimadores de minimos cuadrados de A> 
y / 3 , son los MELI para Ai y A- 

Teorema 13.1 Sean las suposiciones para el modelo Y i = A> + A-L + e,lasmis- 
mas que aquellas que se necesitan para la estimation de minimos cuadrados de A) y 
A • Entonces los estimadores de minimos cuadrados de B 0 y son los mejores esti¬ 
madores lineales no sesgados de A> y A. 

Mientras que la demostracion del teorema 13.1 se encuentra mas alia de los obje- 
tivos de este libro, se demostrara que B 0 y son combinaciones lineales de las ob¬ 
servaciones Y ), Y 2l .... Y „. Lo anterior permitira demostrar que 

£(A) = A. 

y 

Var(B,) =-a—?- -, (13.13) 

2 (.v, - xf 

i = I 

mientras que 

B(B 0 ) = A) 

y 

i * 

Var(B lt ) = 1 -. (13.14) 

n 2 (-*; - • 3 : ) : 

I - I 

Para demostrar que B , es una combinacion lineal de L,, Y 2 . Y„. recuerdese 

la segunda expresion dada en (13.6). Primero, se desea demostrar que 


X (x, - v) ( Y, - Y) = 2 ( L ' *> Y ‘ ■ 

i -1 i=i 
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Lo anterior es verdadero, dado que 

2 (*/ - x) (K, ; - Y) = Y U - x)Y, -yY, Ui - *); 

pero 2(x, - x) = 0, y 

, 2 (x, - x)(Y, -Y) = Y (x, ~ x)Y,. 

De acuerdo con lo anterior, 


Y (Xj - X)Y; 


B, - ^r 


Y (*. x ) 2 


donde las x, son fijas ya que son valores de una variable de prediction no aleatoria. 
Sea 


x, — x 


C i n 


(13.15) 


2 Xx i - x) 2 


donde los c,’ son cantidades fijas, dado que las x,’ tambien son fijas. Entonces el es- 
timador B , se expresa como 


A = 2 eft, 

t= 1 

la cual es una combination lineal de las observaciones Y ,, Y 2 , Y„. 
Para demostrar que B, es un estimador no sesgado de fi,, se tiene 


Pero 


E(B,) = £(£ c,Y,j 

= Y c.-EfYi) 

= 2 C i(0O + IX,X.) 


n 


n 


— A> Y c, + fx, Y 

i= i ;= i 


C,X; . 



Y (Xj - X) 

1= I 


2 (*; “ 0 2 


= 0, 


www. FreeLibros. com 



13.5 Propiedades generates de tos estimadores de minimos cuadrados 459 


y 


n 


2 C/JT, 

1=1 


De esta forma, 


2 V U, - DC* - I) 

I e, - s’ ‘ 2 ( " - I)! 

i= 1 

£(B,) = j8,. 


Dado que por hipotesis las observaciones K, no se encuentran correlacionadas 
por pares, C<?v(F,, L,) = 0 , i =f= j. Entonces, mediante el empleo de la segunda 
parte del teorema 6.1, se demuestra que la varianza de B x esta dada por (13.13.) De 
esta forma se tiene 


Var(B t ) 


Varl'ZcM 

\l= I 

2 cfVariY,) 

2 fa 2 


2 c 2 


(7 


.Ti \ 2 u 


(*, - ■*) 2 
i (Xi - X ) 2 


0-2 I 2 (Xi - X ) 2 


2 (Xi - x) 2 j 


2 (Xi - x) 2 

i= I 

La raiz cuadrada de Var(B x ) es la desviacion estandar* del estimador de minimos 
cuadrados de la pendiente y esta dada por 


d.e.(B t ) 


(T 


2(x, - x ) 2 


1/2 


Dado que, en general, la desviacion estandar a del error es desconocida, puede obte- 
nerse un estimador de d.e.(B x ) al reemplazar cr por la desviacion estandar residual s, 
como esta dada por (13.11). De esta forma, unestimado de la desviacion estandar de 
B i es 


* Tambien conocida como error estandar. 
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s(B t r 


S u - x ? 


1/2 


(13.16) 


Ahora considerese el estimador de minimos cuadrados de la intersection desco- 
nocida (3 0 . Dado que el estimador de minimos cuadrados es 

B 0 =Y - B,x, 

y ya que el estimador de minimos cuadrados de la pendiente es una combinacion li¬ 
neal de las observaciones P,, Y 2 , ..., Y n , entonces tambien B 0 es una combinacion 
lineal de las observaciones. Para demostrar que B 0 es un estimador no sesgado de 
/3 0 , se tiene 

E(B 0 ) = E(Y - B t x) 


n 

S e(y,> 

—- xE(B,) 

n 

2 03 o + Pi*i) 


"Po + P, S x i 


= Po + Pi x - P\ x 
= Po- 


Para demostrar que Va/-(fi 0 )esta dada por (13.14), de nuevo se empleara la se- 
gunda parte del teorema 6.1 y el hecho de que B 0 y B , son combinaciones lineales de 
variables aleatorias no correlacionadas. Dado que B 0 = Y - B,x, 

Var(B 0 ) = Var(Y - B,x) 



* Se empleara la noiacion mas conveniente ^(7) y s(T) para denotar, respectivamenie, la varianza y la 
desviacion estandar estimadas de un estimador. T. 
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= 2 ^ - xc j Var{Y,) 


^(---Sc + ^Se?). 

\nn ' 


A1 sustituir (13.15) por c, y alrecordar que 2c, = 0, se tiene 

r 


. i 1 v (.v, - .v)- 
Var(B u ) = r - tr], 

\n 


E (.v, - -v) 2 


= cr 


1 

- + 


L" 2 u - x) 2 \ 


Finalmente, si se sustituye jr = (Zxf/n 2 , se obtiene 

12 -1 


Vor(fio) = cr 2 


I 


2* 


n n 2 2 (*; ~ -O 2 


= (J 


n E (*/ - *) 2 + (X ■*# 

« 2 E (■*.•--v ) 2 ' 


cr 2 E -V? 

/= I 

/f 

n E (v, - -v) 2 

< = i 

Entonces, un estimador de la desviacion estandar de B„ es 

n 

E -v, 2 

s(B„) = s 


n E (•*; - *) 2 


(13.17) 
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Es interesante notar que las varianzas de B 0 y son funciones de los valores x, 
para los cuales se observa la variable respuesta. En particular, para el estimador de 
la pendiente B,, Var(B,) tiene un valor maximo cuando 2(x, - I) 2 tiene un valor 
maximo. Pero 2(x, - x) 2 es maxima cuando la distancia entre los valores de jr. es 
la m&s grande. Esto ocurre cuando se escoge observar la respuesta solo en los valores 
de los extremos del intervalo de variacion de la variable de prediccion, es decir, si 
verdaderamente el modelo de regresion es lineal, entonces deberan tomarse n/2 ob¬ 
servations en un extremo y n/2 en el otro para obtener la mejor eficiencia posible al 
estimar la pendiente de la linea recta. Lo anterior es logico ya que solo se necesitan 
dos puntos para definir una linea recta; sin embargo, en la practica, no es muy co- 
mun el hecho de saber que la fun cion de regresion es lineal de manera tal, que no 
seria prudente seleccionar los extremos del intervalo de x como puntos de observa¬ 
tion y minimizar la varianza del estimador de la pendiente. Una alternativa mas se- 
gura consiste en tener puntos de observation espaciados de igual forma sobre todo el 
intervalo de interes de la variable de prediccion. 

Para el modelo lineal simple, la recta de regresion estimada dada por (13.7) permite 
obtener un estimador para la media de la variable de respuesta para un valor espedfico 
de la variable de prediccion. Sea x p este valor en particular y para el cual se desea estimar 
la media de la variable respuesta Y p . Entonces el estimador es y p = b 0 + b x x p . Para el 
mismo conjunto de valores de x existe una variacion muestra a muestra en el estimador 
Y p , dado que existe una variacion del mismo tipo para los estimadores de minimos cua- 
drados B 0 yB t . Puede observarse que lo anterior es cierto para el ejemplo del salario ini¬ 
tial, ya que no se espera tener la misma recta de regresidn estimada si se selecciona otro 
conjunto de estudiantes con las mismas CP que los primeros. 

Considerese que la determination de la media, y la varianza de Y p . Y p es un esti¬ 
mador no sesgado de la media de Y p , dado que 


E(Y P ) = E(B 0 + B ]Xp ) = (3 0 + (3,x p = E(Y P ). 

Para obtener la varianza de Y p , se hara uso de la misma tecnica empleada para la va¬ 
rianza de B 0 . De (13.8) se tiene 

Var(Y p ) = Var[Y + B t (x p - x)] 


= Var 


■2y, 


+ (x p - .v) 2! CjYi 


= Var{ 2 


- + - .v) 


Y, 


- + C;(X p - .V) 


n 


Var(Y') 


= (T 


= a 


I 2(x p v) V , , V 2 

- + — - -Z <■/ + - -v) 2 j c ‘ 

n n 


1 . (x„ - x) 2 


In 2 U. - -U 2 J 


( 13 . 18 ) 
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Por lo tanto, un estimador de la desviacion estandar de Y p esta dado por 

f 1 <x - n 2 1 1/2 


(x p - xf 

Y ( X i - J ) 2 


(13.19) 


Supongase que en lugar de estimar la media de Y p en x p , se desea predecir un 
valor particular de Y p que se observaria si se impusiera un valor x p para la variable 
de prediccion. Por ejemplo, dada la ecuacion de regresion estimada, £cual podria ser 
el valor del salario inicial para un estudiante en particular con un CP conocido? Aun- 
que se trata de un solo estudiante, puede ser razonable predecir el salario inicial pro- 
medio para un CP dado. De esta forma, si se desea estimar la media de Y p o un 
valor particular de Y p para x p , el valor estimado es el mismo y esta dado por (13.7). 
Pero es evidente que la varianza de la prediccion para este ultimo caso puede tener 
un valor mas grande, ya que esta no solo considera la variacion muestra a muestra 
de Y p , sino tambien la variacion inherente de la distribution de probabilidad de Y p . 
Si se supone que el valor predicho de Y p para x p es independiente de la muestra que pro- 
porciona la recta de regresion estimada, la covarianza de Y p y Y p es cero. Entonces 

Vflr(? part ) = V a r(Y p ) + Var{Y p ) 


= a" + 


+ o - 2 [- 
n 

1 + - 4 

n 


(, x p - x) 2 
Y (X; - x) 2 

(Xp - xf 

Y U; - x ) 2 \’ 


(13.20) 


donde P part denota la prediccion particular para Y p en x p . Del analisis anterior se 
obtiene que un estimador de la desviacion estandar de Y^ n esta dado por 


i(Ppa rt ) 


1 (x - I) 2 1 1/2 
= v I + I + 

L n Y (xi - x ) 2 


(13.21) 


Mediante el empleo de los datos que aparecen en la tabla 13.2, se ilustra el calcu- 
lo de las varianzas y las desviaciones estandar de los estimadores de minimos cuadra¬ 
dos B | y B 0 . Dado que 


2 ( x , - x ) 2 = Yx?-\Y *■ ) 2 /« = 0.886 


y s 2 = 1.759, 


s,(B ‘> ’ S= , - 985 - 


De manera similar, 


s(5,) = 1.409. 


2 ,„ , (1.7591(139.51) a _ 

5 <B " ) = (is Mm ‘ l8 ' 465 
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y 

s(ff 0 ) = 4.297. 


Si se continua con este ejemplo, supongase que se desea estimar la media de la 
distribucion de salarios inciales cuando el CP es x p = 3.25. N6tese que este valor 
no es uno de los valores de x que dieron origen a la recta de regresion estimada, pero 
se encuentra dentro del intervalo definido por estos valores. De (13.10) y (13.18) la 
media y la varianza estimadas para x p = 3.25, son 

% = -6.63 ± 8.12(3.25) = 19.76 


y 


s\Y p ) = 1.759 


(3.25 - 3.04) 2 
15 + 0.886 


0.205, 


respectivamente. De esta forma, la desviacibn est&ndar estimada es\/0.205 = 0.453 
miles de dblares. Si se desea predecir el salario inicial real para un estudiante en par¬ 
ticular con una CP de 3.25, el valor estimado seria aim de 19.76 miles de dolares, 
pero la varianza estimada seria de 


1.759 


J_ (3.25 - 3.04) 2 
15 + 0.886 


1.964, 


o una desviacion estandar de 1.401 miles de dolares. 

En esta seccion se han determinado las medias y las varianzas de los estimadores 
B 0 , B u Y p y P part , pero aun no se han desarrollado sus distribuciones de muestreo. 
Para realizar esto es necesario suponer el caso de la teoria normal de la seccidn ante¬ 
rior, en el que se supone que cada error aleatorio e, tiene una distribucion normal 
con media cero y varianza o- 2 para toda i = 1 , 2, ..., n. Por lo tanto, las observa- 
cionesP,, P 2 , ..., Y„ son variables aleatorias independientes y distribuidas en forma 
normal con medias (3 0 + /3,jc, y varianza comun cr 2 , para i = 1, 2, ..., n. 

Para obtener la distribucion de la muestra para el estimador de la pendiente B t , 
bajo el caso de la teoria normal, solo necesita recordarse que B t es una combinacion 
lineal de variables aleatorias normalmente distribuidas y, de esta forma, la combina¬ 
cion es una variable aleatoria con distribucion normal, media /6, y varianza dadas 
por (13.13). A1 recordar la definicion de una variable aleatoria t de Student puede 
demostrarse que la distribucion de la cantidad 

( 5 , - fiMB,) 

es la t de Student con n - 2 grados de libertad. El estimador B 0 tambien es una com¬ 
binacion lineal de variables aleatorias normalmente distribuidas. Asi, B 0 tambien es 
normalmente distribuida, con media f3 a y varianza dadas por (13.14). Ademas, se 
puede mostrar que la cantidad 


(P» Po)MB 0 ) 
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es una variable aleatoria de la t de Student con n — 2 grados de libertad. Como se 
vera en la siguiente seccibn, estos resultados permiten la formulacibn de inferencias 
estadisticas con respecto a los parametros desconocidos 0 O y 0|. 

Bajo el caso de la teoria nonnal, el estimador Y p = B 0 + B, x p de la media de 
Y p para x„ tambien se encuentra normalmente distribuido con media E( Y p ) y 
varianza dada por (13.18), ya que esta es una combination lineal de variables aleato- 
rias normalmente distribuidas. Entonces, la distribution de 

[Y p - E{Y p )]/s{Y p ) 

es la t de Student con, de nuevo, n - 2 grados de libertad. Tambien se obtiene un re- 
sultado similar para la prediction ? part para una respuesta en particular Y p corres- 
pondiente a x p . Asi, resulta comprensible elporque n-2 grados de libertad, ya que 
la determination de la recta de regresion necesita la estimation de los dos parame¬ 
tros de regresion 0 O y /3,. 


13.6 Inferencia estadistica para el modelo lineal simple 

En la section precedente se examinaron las propiedades teoricas de los estimadores 
para el modelo lineal simple. En esta section se emplearan esas propiedades para 
llevar a cabo un analisis de regresion, es decir, se desarrollaran pruebas de hipotesis 
e intervalos de confianza para las cantidades de interes en este modelo. 

El parametro clave del modelo lineal simple 

y, = 00 + 01 X; + e, 

tiene que ser la pendiente 0, . Si la respuesta Y se encuentra relacionada en forma li¬ 
neal con la variable de prediccion x, la pendiente 0, tiene que ser diferente de cero. 
De otra forma, no existe ninguna relation lineal entre Yyx. Un procedimiento infe¬ 
rential natural para /3, es construir un intervalo de confianza del 100(1 - a)% 
para /3,. Si este intervalo no contiene el valor cero, entonces es razonable concluir 
que 0, es diferente de cero y que Y y x estan, en algun grado, relacionados en forma 
lineal. 

Recuerdese que bajo el caso de la teoria normal, la variable aleatoria (/?, — /3,)/- 
s(B ,) tiene una distribucion t de Student con n-2 grados de libertad. Entonces 

P\B\ — /, u/ 2 „ ) < 01 < B t + /| - r,/2. = 1 — tt, 

o la probabilidad de que el intervalo aleatorio [/?, - t t B, + 

„_ 2 .v(B,)] contenga el valor real de la pendiente 0 i es 1 - a. A1 reemplazar el 
estimador de minimos cuadrados B 1 por su estimador dado por (13.6), el intervalo 
de confianza del 100(1 — a)®7o para 0, es 

b y ± „- : .?(B|), 

donde la desviacion estandar estimada s(B,) esta dada por (13.16). Como ejemplo, 
recuerdese la recta de regresion estimada _v, = -6.63 + 8.12.V, para los datos de 


www. FreeLibros. com 



466 Analisis de regresion: el modelo lineal simple 


los salarios initiates. Dado que b } = 8.12 y .?(#,) = 1.409, entonces un intervalo 
del 95% de confianza para /3, es 

8.12 ± (2.160)0.409) = (5.08, 11.16), 

donde t 0 975 . , 3 = 2.160. La interpretation de este intervalo es la siguiente: suponga- 
se que se toman muestras repetidas, cad a una del mismo tamaflo n, de la variable de 
respuesta para algunos de los valores de x que producen la recta estimada y, = — 
6.63 + 8.12.V,, construyendose para cada muestra un intervalo de confianza del 
95% para / 3 ,. Por lo tanto, el 95% de todos estos intervalos incluira el valor real de 
la pendiente >3,. 

Considerese la prueba de la hipotesis nula 


Hu- Pi — Pi„ 

contra la alternativa 

//, : / 3 , * Pu, 


donde p h es el valor propuesto de la pendiente desconocida Pi. Bajo H 0 , la estadis- 
tica 

5 (^ 1 ) 

tiene una distribution t de Student con n — 2 grados de libertad. De esta forma, 
para un tamaflo dado del error de tipo I puede tomarse una decision, en forma f&cil, 
con base en la evidencia de la muestra. Notese que tambien es posible tener hipotesis 
alternativas unilaterales. 

A1 igual que en los casos ya analizados, cualquier valor propuesto de Pi que se 
encuentre en el correspondiente intervalo de confianza, causara una equivocacion 
al rechazar a H 0 . En general, el valor propuesto es el cero; es decir, la hipotesis nula 
establece que no existe ninguna asociacion lineal entre xy Y, asi que el valor de la es- 
tadistica de prueba es 

t = bJs(Bi). 


Como ejemplo, considerese la prueba de la hipotesis nula 


contra la alternativa 


Hn-.Pi = 0 

Hi-. Pi >0 


para el ejemplo de los salarios iniciales contra CP. Se ha seleccionado una hipotesis 
alternativa unilateral, ya que el sentido comun dicta que si existe una relacion lineal 
entre CP y el salario inicial, la pendiente debera ser positiva. Para a = 0.01; enton- 
ces /(,99 i 3 = 2.650, y 

l = 8.12/1.409 = 5.76. 


Por lo tanto, se rechaza la hipotesis nula de que la pendiente es cero. Este resultado, 
junto con el intervalo de confianza para p ,, sugiere que el salario inicial promedio se 
encuentra influenciado, en forma lineal, por la calificacion promedio. 
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Tambien puede construirse un intervalo de confianza para el parametro de inter- 
seccibn y3 0 en forma similar. Dado que (B 0 - / 3 a )/s(B {) ) ~ t de Student con n - 2 
grados de libertad, 

P[B q — t\-a/2. < B 0 3- ti- a /2. n -2 s (Bo)] = I ~ « 

\ 

es un intervalo aleatorio para (3„ con probabilidad 1 - a. Por lo tanto, un interva¬ 
lo de confianza del 100(1 - <x)% para /?„ es 

^0 —l I -a/2. ,i-2 S (B o) 

donde b () es el estimador de minimos cuadrados y s(B 0 ) es la desviacion estandar esti- 
mada. De nuevo, para el ejemplo de los salarios iniciales, un intervalo de confianza 
del 99% para )3 0 es 


-6.63 ± (3.012)(4.297) = (-19.57. 6.31). 

El lector debe darse cuenta que el significado de un intervalo como el anterior no 
es del todo aparente, ya que el modelo de regresion no tiene ser.tido si la calificacion 
promedio es cero. En general, deben evitarse las inferencias con respecto a la inter¬ 
section, a menos que exista un valor de la respuesta para x = 0. 

Ahora, considerese la estimation por intervalo de la media de Y„ para x p . Re- 
cuerdese que bajo el caso de la teoria normal, el estimador Y p = B lt + B t x p tiene 
una distribucibn normal con media E(Y P ) y varianzadadapor(13.18)yladistribu- 
cion de muestreo de [ Y P - E{ Y p )\/s(Y p ) es la t de Student con n - 2grados de liber¬ 
tad. Entonces la probabilidad del intervalo aleatorio 

— U-a/2. n-2 S (Yp) < E(Y p ) < Y p + /1 _ a/2. 


'es 1 - a, y un intervalo de confianza del 100(1 - «)% para E( Y p ) es 

y p — h-a/2. n-2 S (Ypb 

Para el ejemplo de los salarios iniciales, supongase que se desea construir un in¬ 
tervalo de confianza del 95% para la media de Y p en x p = 2.80. El valor estimado 
cs 

y p = -6.63 + 8.12(2.80) = 16.11 


y la desviacion estandar estimada es 

= 0.481. 

Dado que t 0 975 , 3 = 2.160, un intervalo de confianza del 95% para £( Y p ) es 
16.11 ± (2.160)(0.481) = (15.07, 17.15). 


v( Y p ) = 1.759 


J_ (2.80 - 3.04)- 
15 + 0.886 


A1 seguir este procedimiento, pueden obtenerse intervalos de confianza del 95% 
para £?( Y p ) para distintos valores de la variable de prediccion. Los resultados se en- 
cuentran resumidos en la tabla 13.3. 
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TABLA 13.3 Intervalos de confianza para los salarios iniciales medios 

X P 

% 

s(%) 

Intervalo de confianza del 95% 

2.60 

14.48 

0.708 

(12.95, 16.01) 

2.70 

15.29 

0.589 

(14.02, 16.56) 

2.80 

16.11 

0.481 

(15.07, 17.15) 

2.90 

16.92 

0.395 

(16.07, 17.77) 


17.73 

0.347 

(16.98, 18.48) 

3.10 

18.54 

0.353 

(17.78, 19.30) 

3.20 

19.35 

0.410 

(18.46, 20.24) 

3.30 

20.17 

0.501 

(19.09, 21.25) 

3.40 

20.98 

0.612 

(19.66, 22.30) 

3.50 

21.79 

0.733 

(20.21, 23.37) 

3.60 

22.60 

0.860 

(20.74, 24.46) 


Para ilustrar la natu.aleza de estos intervalos de confianza, cuando se comparan 
con los valores de la variable de prediction, se grafica la recta estimada de regresion 
y despues los limites inferior y superior de cada intervalo contra x „. El resultado se 
ilustra en la figura 13.3. Notese que los limites inferior y superior forman dos hiper- 
bolas con respecto a la recta de regresion estimada. La distancia vertical entre cada 



FIGURA 13.3 Intervalos de confianza y la recta de regresion estimada 
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curva y la recta de regresion es mas pequefia para el punto x = 3.04 y aumenta, en 
forma simetrica, en ambas direcciones al alejarse de x. Si se plantea en forma senci- 
11a, los resultados anteriores indican que la prediccion de E( Y p ) es mas confiable (va- 
rianza mas pequefia) alrededor de la mitad de los valores de x obtenidos por 
medio de la ecuacion de regresion que en los extremos del intervalo de valores x. 

Recuerdese que el usuario puede estar mas interesado en predecir una respuesta 
particular para una x dada, que en estimar la respuesta media para ese mismo valor 
x. Mientras que el valor predicho puede ser el mismo en cualquier caso, la variabili- 
dad del estimado con respecto a la respuesta en particular sera decididamente mas 
grande que la correspondiente a la respuesta media. Dado que, bajo el caso de la 
teoria normal, la cantidad [Y^n ~ Y p ]ls(Y pan ) es una variable aleatoria t de Stu¬ 
dent con n - 2 grados de libertad entonces, para un a dado, 

^*1 ^pail ~ ^I-a/2, /i-2^( ^parl) < ~ Y p < Ypan + 11-a/2, „ - 2^( ^parl )1 — 1 — Of- 

Con base en este resultado puede obtenerse lo que, en general, recibe el nombre 
de intervalo de prediccion para la observacion Y p . Un intervalo de prediccion es el 
analogo del intervalo de confianza. Un intervalo de prediccion del 100(1 - a)% 
para una observacion particular Y p , es 

^part — t\-a/2, n - 2^( fpart )• 

Como ejemplo, se construira un intervalo de prediccion del 95% para el salario 
inicial de un recien graduado con una calificacion promedio de 2.80. El valor predi¬ 
cho puede ser el mismo que el de la respuesta media, 


5W = - 6.63 + 8.12(2.80) - 16.11; 
pero la desviacion estandar estimada es 


■SOW,) = 1.759 


t J_ (2.80 - 3.04) 2 
+ 15 + 0.886 


1/2 


= 1.411, 


la cual es mucho mas grande que el valor comparable de 0.481 para Y„. Por lo tanto, 
un intervalo de prediccion del 95% para Y r , es 


16.11 ± (2.160)(1.411) = (13.06, 19.16). 


En la tabla 13.4 se proporcionan los intervalos de prediccion del 95% para las obser- 
vaciones de la respuesta correspondiente a cada uno de los valores de x que se en- 
cuentran en la tabla 13.3 y que no son parte del conjunto original que dio origen a la 
ecuacion de regresion estimada. Como era de esperarse, los intervalos de prediccion 
para las observaciones individuales de la respuesta son mucho mas grandes que los 
correspondientes intervalos de confianza para la media de la misma. 

Ya que el an&lisis de regresion se basa en la teoria normal, es apropiado formular 
un comentario con respecto a las consecuencias sobre la inferencia cuando las distri- 
buciones de probabilidad de los errores aleatorios no son normales. Si la desviacion 
con respecto a la normalidad no es muy grande, las distribuciones de muestreo de los 
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TABLA 13.4 Intervalos de prediction para los salarios iniciales individuales 


X P 

^pan 

... *(W 

Intervalo de prediccidn del 95% 

2.60 

14.48 

1.503 

(11.23, 17.73) 

2.80 

16.11 

1.411 

(13.06, 19.16) 

2.90 

16.92 

1.384 

(13.93, 19.91) 

3.00 

17.73 

1.371 

(14.77, 20.69) 

3.30 

20.17 

1.418 

(17.11, 23.23) 

3.50 

21.79 

1.515 

(18.52, 25.06) 


estimadores seran muy cercanas a la normaiidad y se acercaran a esta conforme 
aumente el tamafio de la muestra. Bajo estas condiciones, la distribution t de Stu¬ 
dent sigue siendo muy robusta y proporciona aproximaciones muy cercanas a los ni- 
veles de confianza propuestos. 


13.7 El uso del analisis de varianza 

El analisis de regresion para el modelo lineal sencillo tambien abarca la aplicacion de 
la tecnica del analisis de varianza analizada en el capitulo 12. En sintesis, la tecnica 
del analisis de varianza proporciona solo un medio alternative al de la section 13.6 
para probar la hipotesis nula de que la pendiente es cero. Sin embargo, permite una 
comprension natural del problema y por lo tanto es muy util para el analisis de mo- 
delos mas complicados, lo cual se hara mas adelante. 

Recuerdese que la tecnica del analisis de varianza divide la variation total de las 
observaciones en sus partes componentes de acuerdo con el modelo propuesto. En 
esencia, para el modelo lineal simple la variation total es la suma de dos componen¬ 
tes: la causada por el termino no aleatorio /3 ( jc, y la que se debe al error aleatorio e. 
Dado que lo que se pretende es que la recta estimada de regresion explique la mayor 
cantidad posible de la variation total, la contribution del termino /3,.v debe ser sus- 
tancial. El resultado anterior implicaria que las variables respuesta y prediction 
estan relacionadas en forma lineal. Si /3, = 0, no existe una asociacion lineal entre x y Y. 

Para desarrollar el enfoque del analisis de varianza, se seguira el procedimiento 
establecido en el capitulo 12. Considerese la desviacion de la observation Y, de la 
media de las observaciones Y. Por el momento, supongase que todas las observacio¬ 
nes Y i son iguales entre si, asi que la pendiente (3, debe ser cero, e, = 0, y P, = Y 
para toda i. Por otro lado, si la magnitud de la desviacion Y, - Y es mayor que 
cero, esta debera atribuirse a las componentes del modelo. 

Para la desviacion 

Y> - Y 

supongase que se suma y se resta el estimador Y, para la media de Y n tal como se 
obtiene de la ecuacion de regresion. Entonces 

Y, -Y = Y, -Y + Y, - Y, 

= ?,-?+ Y, - Y,. 
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De esta forma, la desviacion total de la observation Y, con respecto a la media 7, es 
la suma de la desviacion de la respuesta media estimada K, de Y y la desviacion de 
Yj con respecto a Y,-. Notese que la ultima diferencia es el estimador para el /-esimo 
residuo, el cual representa la distancia vertical desde la respuesta observada al punto 
correspondiente sobre la recta de regresidn estimada. Las desviaciones P, - ?, re- 
presentan la contribution a la componente de error a la variaci6n total. Recuerdese 
que Yj estima la media de Y, para x,. Si la variable de prediccionjio tiene ningun 
efecto lineal sobre la respuesta, entonces Y, es virtualmente igual a Y para toda /; es 
decir, /3, = 0, y el estimador de minimos cuadrados de /3 0 es Y. Si la magnitud de la 
desviacion de Y t - Y es grande, entonces se tiene un efecto lineal de x sobre Y (fi, 
* 0 ). 

Para proseguir con el enfoque del analisis de varianza se tomara el cuadrado de 
ambos miembros de la identidad 

Yi-J=Yi-Y+ Y, - Y„ 

y se sumaran para todas las observaciones I(Y, - Y) 2 . Entonces se tiene 

n n n n 

2 (Y, - ^) 2 = 2 (Y, - Y) 2 + 2 (Y, - Y,) 2 + 2 2 (?,. - Y)(Y, - %). 

>= i i=i i=i i=i 

Para demostrar que los productos cruzados son cero, se vuelve a escribir la ultima su¬ 
ma como 

2 (Y, - Y)(Y, - %) = ^ \Y,(Y, - %) - Y(Y, - ?,)] 

= 2 Y(Y, - %) - 72 O', - Y,). 

De acuerdo con la propiedad 1 de la recta de regresion estimada, examinada en la 
seccion 13.3, la segunda suma es cero. La primera suma puede escribirse como 

2 Y,(Y, - %) = 2 Y, e, 

= 2 Wo + B lXi ) e, 

= B 0 2 e i + B, 2 •*, e i 

= 0 . 

Dado que Se, y Sx, e, son cero de las propiedades 1 y 3, respectivamente, por lo 
tanto la ecuacion fundamental del analisis de regresion es 

i(fr Y) 2 = 2 (?, - Y) 2 + 2 W - F,) 2 . (13.22) 

1=1 /= I /=I 

De acuerdo con la terminologia dada en el capitulo 12, el termino S(P, - Y) 2 
es la siima total de cuadrados STC la cual toma en cuenta la variacidn total de las obser¬ 
vaciones Y, con respecto a su media sin considerar la variable de prediccidn. Las compo- 
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nentes de STC son la suma de los cuadrados de los errores SCE = 2( Y, - K, ) 2 y la 
suma de los cuadrados de la regresidn SCR= £(?, - Yf.SCE toma encuentala va¬ 
riation de las observaciones con respecto a la recta de regresidn estimada. Si todas 
las observaciones se encuentran sobre la recta estimada, el valor de todos los residuos 
es cero y SCE = 0. Se desprende el hecho de que entre mis grande es el valor de SCE, 
mayor es la contribution de la componeme de error a la variation de las observacio¬ 
nes, o mayor es la incertidumbre cuando se estima la respuesta mediante el uso de la 
ecuacion de regresion. Por otro lado, SCR representa la variation de la observation 
que es atribuible al efecto lineal de x sobre Y. Si la pendiente de la recta estimada de 
regresion es cero, entonces SCR = 0. De esta forma, entre mas grande es la propor¬ 
tion de SCR con respecto a SCT, mayor sera la cantidad de la variation en las obser¬ 
vaciones que puede explicarse mediante el termino lineal (3 t x 

iCual es el numero de grados de libertad asociado con cada termino de (13.22)? 
Recuerdese la definition del numero de grados de libertad asociados con una suma 
de cuadrados dada en el capitulo 12. Para STC existen n - 1 grados de libertad ya 
que se pierde uno por causa de la restriction lineal 2(K, - Y) = 0 entre las obser¬ 
vaciones Y r Notese que SCE es el numerador de la expresion (13.11) para el calculo 
de la varianza residual, asi que el numero de grados de libertad para SCE sera de 
n - 2* Dado que los grados de libertad son aditivos, 

gl(SCR) = gl(STC) — gl(SCE), 

y SCR tiene un grado de libertad. Como se observara posteriormente, cuando se tra- 
ten modelos mas complicados, el numero de grados de libertad para SCR sera 
siempre igual al numero de parametros de regresion en el modelo, sin contar a /3 0 . 

Para el analisis de varianza se buscara una estadistica para probar la hipotesis 
nula 

H 0 : >3,-0 

contra la alternativa 

* 0 . 


En general, H 0 se conoce como la hipotesis de regresion no lineal entre x y Y. Si se 
supone el caso de la teoria normal, entonces bajo la hipotesis nula las observaciones 
Yi son n variables aleatorias independientes normalmente distribuidas con la misma 
media p = (3 0 y varianza a 2 . Por lo tanto, puede demostrarse que SCR/<x 2 . y SCE 
/a 1 son dos variables aleatorias independientes con una distribucion chi-cuadrada 
con 1 y n - 2 grados de libertad, respectivamente. Entonces, del teorema 7.8, la va¬ 
riable aleatoria 


SCR/cr 2 


SCE/cr 2 
n - 2 


SCR/1 
SCE/(n - 2) 


= CMR/CME 


(13.23) 


* Los dos grados de libertad que se pierden se deben a las dos restricciones lineales dadas por las propie- 
dades 1 y 3 de la seccion 13.3. 
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tiene una distribution F con 1 y n - 2 grados de Iibertad, donde el cuadrado medio 
del error es igual a la varianza residual. 

Para llegar a la regi6n de rechazo apropiada para H 0 sugerida por (13.23), se 
empleari la intuicibn. Con base en un conjunto dado de datos, un valor grande de 
CME comparado con CMR implicara ajuste pobre y sugerira la ausentia de una aso- 
ciacion lineal entrexy Y. Pero un valor relativamente pequeflo para CME implicara 
el hecho de que una portion considerable de la variation en las observaciones es atri- 
buible a un efecto lineal de x sobre Y. Por lo tanto, la hipotesis nula de regresion no 
lineal entre .vy y debe rechazarse siempre que el valor de (13.23) sea relativamente 
grande. De otro modo, la evidencia experimental no apoya el rechazo de H 0 . Sobre 
una base mas teorica, puede demostrarse que 


y 


£(CMR) = a 2 + 1 3? £ (* " x) 2 
E(CME) = cr 2 . 


Si H 0 es cierta, entonces el valor esperado de CMR tambien es cr 2 . Pero si /?, f 0, 
£(CMR) es mayor que cr 2 ,ya que el termino (i) 1(x, - xf es positivo. Por lo tanto, 
la estadistica apropiada esta dada por (13.23) con el extremo superior de la distribu¬ 
tion F como region critica; es decir, para un tamano dado del error de tipo I a se re- 
chaza la hipotesis nula de no regresion lineal cuando un valor de F = CMR/CME se 
encuentra dentro de la region critica superior de la distribution F con 1 y n - 2 gra¬ 
dos de Iibertad. La tabla de analisis de varianza (ANOVA) para el modelo lineal 
simple se encuentra en la tabla 13.5. 

Para calcular las sumas de cuadrados que aparecen en la tabla 13.5, se tiene 


stc = X (y, - yf = 2 yf - 

SCE = 2 (y, - 9i) 2 = 2 C’ 



donde y t , y 2l ..., y„ son las verificaciones de las observaciones, y e u e 2 , .... e„ 
son los residuos correspondientes. Entonces SCR = STC - SCE, o puede calcularse 


TABLA 13.5 Tabla ANOVA para el modelo lineal simple 


Fuenle de 
variation 

gl sc 


CM 

Estadistica F 

Regresion 

i 2 Cr, - n 2 

STl - 

K )71 

X (Y, - Yf /1 

Error 

n - 2 2 (y, - Y f 

liY, - 

r-i 

1 

2 

M 

^ (T - Y,f/{n - 2) 

Total 

n - 1 X (L - 
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en forma directa. Dado que la recta estimada es 

?i = y + - r) 

o 

Si - y = bf Or, - X ), 

» 

al elevar al cuadrado ambos miembros y si se suman para todas las / = 1,2 ... n se 
obtiene 

SCR = X (y, - yf = b]^ U, - x) 2 - (13.24) 

Como ejemplo, recuerdese de nuevo el problema de los salarios inciales. Supon- 
gase que se desea probar la hipotesis nula de que no existe una regresion lineal entre el 
salario inicial y CP, contra la altemativa de que esta existe, con a = 0.01. Mediante 
el uso de la tabla 13.2 se calculan las siguientes cantidades: 

(270 «) 2 

STC = 4970.12 - v yj — = 81.2773, 

SCE = 22.8671, 

SCR = 81.2773 - 22.8671 = 58.4102. 

Para n = 15 se proporciona la tabla ANOVA en la tabla 13.6. Dado que f - 33.21 
> f 0 99 , l3 = 9.07, se rechaza la hipotesis nula de no regresion lineal y se concluye 
que el salario inicial promedio esta influenciado, en forma lineal, por la calificacion 
promedio. 

Como es de esperarse, existe una relacion entre la estadistica F anterior con 1 y n 
- 2 grados de libertad y la correspondiente estadistica t de Student (vease la seccion 
13.3) para una hipotesis alternativa bilateral. Puede establecerse la relacion median¬ 
te lo siguiente: dado que 


SCR = B] 2 U, - x) 2 
s 2 (B } ) = CMe/2 0c, - x) 2 . 


TABLA 13.6 

Tabla ANOVA para los salarios iniciales 



Fuente de 
variaeidn 

gi 

SC 

CM 

Valor F 

Regresion 

1 

58.4102 

58.4102 


Error 

13 

22.8671 

1.759 

33.21 

Total 

14 

81.2773 

Juw. 1 . 

„ = 9.07 
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entonces 

CMR 
CME 

De acuerdo con lo anterior, si una variable aleatoria tiene una distribution Fcon 1 y 
n - 2 grados de libertad, entonces _ \ 

F = T\ 


B\ 2 Or, - x) 2 /\ 


s 2 {B ,) X (•*. “ ■*) 


Z3 = [BjsiB,)) 2 


f/i'rQjsrs 


donde T es una variable aleatoria t de Student con n - 2 grados de libertad. La rela¬ 
tion entre los cuantiles es 

fl-a. \. n-2 ~ t \-a/2. n-2- (13.25) 

Hasta aqui se han examinado algunas maneras para probar la hipotesis nula de 
no regresion lineal entre x y Y. Ahora se presentara una oantidad numerica muy util 
que es una medida relativa del grado de asotiacion lineal entre xy Y. ho que se desea 
es tener una cantidad que mida la proportion de la variation total de las observatio¬ 
ns con respecto a su media la cual es atribuida a la recta estimada de regresion. 
Dado que STC representa la variation total con respecto a la media y SCR mide la 
portion de esta, que es atribuible a un efecto lineal de x sobre Y, una medida apropia- 
da es 


SCR _ STC - SCE _ SCE 
STC ~ STC ~ STC' 


(13.26) 


r 2 recibe el nombre de coeficiente de determination. Los valores que toma estan 
siempre en el intervalo 0 *£ r 2 1 ya que 0 SCE =s STC. De manera ideal, se 
desea tener un r 2 = 1 ya que entonces SCE = 0, y toda la variation presente en las 
observations puede explicarse por la presencia lineal de x en la ecuacion de regre¬ 
sion. De esta forma, entre mas cercano se encuentre r 2 a uno, mayor es el grado de 
asotiacion lineal que existe entre xy Y. Como ilustracion, el coeficiente de determi- 
nacidn para el ejemplo del salario inicial, es 


22.8671 

81.2773 


0.7187. 


Por lo tanto, la presencia lineal de CP en el modelo de regresion explica el 71.87% 
de la variation total en los salarios iniciales observados. 

Ya que muchas veces se da una mala interpretation a r’.debe hacerse un comen- 
tario sobre lo que r~ no mide. r 2 no mide la validez del modelo de regresion pro- 
puesto, es decir, r 2 no puede verificar que la verdadera ecuacion de regresion entre x 
y Y sea estrictamente lineal. Todo lo que puede medir es cuanto se explica de la va¬ 
riation total mediante la ecuacion de regresion estimada. En realidad, el modelo ver- 
dadero de regresion entre xy Y puede contener terminos no lineales en x, u otras 
variables de prediction, o ambos. Estas cuestiones seran examinadas en el capi- 
tulo 14. 
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A continuation se presenta una muestra de un listado de computadora para el 
analisis de regresion lineal de los datos de salarios. La lista de paquetes estadisticos 
disponible para computadora incluye a SAS, SPSS, BMDP y Minitab. El listado que 
se muestra en la figura 13.4 fue generado por Minitab. Notese que incluye los coefi- 
cientes de la regresion estimados, sus desviaciones estandar, la prueba T para pen- 
diente cero, la desviacidn estandar residual (o la desviacion estandar de Y con res- 
pecto a la recta de regresion); el valor de r 2 las sumas de los cuadrados, los cuadra- 
dos medios para el analisis de varianza y los residuos estandarizados definidos en el 
capitulo 12. 


LA ecuaci6n de regresi6n es 

Y = - 6.63 + 8.12 XI 




DEV. EST. 

COCIENTE-T = 

COLUMNA 

COEFICIENTE 

DEL COEF. 

COEF/D.E. 

— 

- 6.627 

4.298 

-1.54 

C2 • 

8.118 

1.409 

5.76 


LA DEV. EST. DE Y CON RESPECTO A LA RECTA DE REGRESION ES 

S = 1.327 

CON ( 15-2) = 13 GRADOS DE LIBERTAD 
R-CUADRADO =71.8% 


ANALISIS DE VARIANZA 


DEBIDA A 

DF 

SC 

CM = SC/GL 


REGRESION 

1 

58.393 

58.393 


RESIDUO 


13 

22.880 

1.760 


TOTAL 


14 

81.274 




XI 

Y 

VALOR 

DEV. EST. 


RENGLON 

C2 

Cl 

PRED. Y 

PRED. Y RESIDUO 

RES. EST. 

1 

2.95 

18.500 

17.323 

0.365 1.177 

0.92 

2 

3.20 

20.000 

19.352 

0.410 0.648 

0.51 

3 

3.40 

21.100 

20.976 

0.612 0.124 

0.11 

4 

3.60 

22.400 

22.600 

0.860 -0.200 

-0.20 

5 

3.20 

21.200 

19.352 

0.410 1.848 

1.46 

6 

2.85 

15.000 

16.511 

0.435 -1.511 

-1.21 

7 

3.10 

18.000 

18.540 

0.353 -0.540 

-0.42 

8 

2.85 

18.800 

16.511 

0.435 2.289 

1.83 

9 

3.05 

15.700 

18.134 

0.343 -2.434 

-1.90 

10 

2.70 

14.400 

15.293 

0.589 -0.893 

-0.75 

11 

2.75 

15.500 

15.699 

0.533 -0.199 

-0.16 

12 

3.10 

17.200 

18.540 

0.353 -1.340 

-1.05 

13 

3.15 

19.000 

18.946 

0.376 0.054 

0.04 

14 

2.95 

17.200 

17.323 

0.365 -0.123 

-0.10 

15 

2.75 

16.800 

15.699 

0.533 1.101 

0.91 


FIGURA 13.4 Listado de computadora para el analisis de regresion lineal (datos de los sala¬ 
rios iniciales) 
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13.8 Correlation lineal 

En la section 6.4 se definio el coefkiente de correlation p dado por (6.14), como 
una medida de la asotiacion lineal que existe entre las variables aleatorias Ay Y. En 
esta secci6n se examinara el coefkiente de correlation de la muestra en el contexto 
del analisis de regresion. 

Durante toda la presentation del analisis de regresion se ha asumido la disponibi- 
lidad de una muestra aleatoria de la variable respuesta I'm Y 2 , ..., Y„, correspon- 

dientes a n valores fijos x t , x 2 . x n de una variable de prediction. Para definir 

el coefkiente de correlacidn de la muestra, se supondrh que tanto A como Y son varia¬ 
bles aleatorias. Sea la distribucidn conjunta de X y Y la normal bivariada (vease la sec- 
cion 6.8), y sean (A,, P,) ( (A 2 , Y 2 ), ..., (X n , Y n ) una muestra aleatoria de tamaflo n 
de esta distribution. Entonces puede demostrarse que el estimador de maxima vero- 
similitud de p (denominado coeficiente de correlacidn de la muestra), esta dado por 


r*(X, Y) 


S (A, - A)(K f - Y) 
1 


i (a - a ) 2 

-i= I 


1/2 




(13.27) 


Despues de efectuar algunos calculos algebraicos, puede obtenerse una expresion 
equivalente de la forma 



A1 igual que el parametro p, r se encuentra en el intervalo - 1 =£ r « 1 y mide la 
relacion lineal entre Ay Y, si A se emplea para predecir Y o viceversa. Con base en 
una muestra aleatoria, un valor de r = - 1 indica una relacion lineal negativa per- 
fecta entre Ay Y, mientras que un valor de r = 1 sefialara una asotiacion lineal 
positiva perfecta de Ay Y. Sir = 0,entonces no existe ninguna relacion lineal entre 
Ay Y. En la figura 13.5 se muestran algunas graficas de dispersion comunes para al¬ 
gunos valores de r. 

A causa de varias interpretaciones injustificables que ha sufrido r, es imperioso 
que el lector comprenda que r por si mismo no puede ni probar ni desmentir una re¬ 
lacion causal entre Ay Y, aun si r = ± 1. Como ya se indico al principio de este 
capitulo, la manifestation de una relacion causa-efecto es posible solo a traves de la 
comprension de la relacion natural que existe entre Ay Y, y esta no debe manifestar- 
se solo por la existencia de una fuerte correlacion entre Ay Y. 


* Se seguira la norma de utilizar una r minuscula. 
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F1GURA 13.5 Graficas de dispersion comunes para algunos valores de r 


Mientras que en el analisis de regresion se supone que los valores de x son fijos, el 
coeficiente de correlacion de la muestra definido por (13.27) o (13.28) es todavia un 
estimador de p. Dado que r mide el grado de asociacion lineal entre x y Y, y ya que 
5 1 es el correspondiente estimador de minimos cuadrados de la pendiente para el 
modelo lineal propuesto entre x y Y, entonces debe existir una relacion entre ry B r 
Mediante el empleo de la segunda ecuacion de (13.6) y (13.27), puede demostrarse 
que el estimador de minimos cuadrados de la pendiente y el correspondiente valor 
del coeficiente de correlacion de la muestra se encuentran relacionados por 

(13.29) 


£ (y. - y> : 


Notese que si /• = 0. = 0 y viceversa. Ademas, el signo de 6, siempre es igual al 

de r. Finalmente, el cuadrado del coeficiente de correlacion de la muestra es el coefi¬ 
ciente de determinacion, es decir, si r y b, son conocidos, entonces se sabe el valor 
de r y su signo; por lo tanto, se sigue que r no solo es una medida del grado de aso- 
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ciacion lineal entre dos variables, sino que puede emplearse una funcion de r como 
una medida de la bondad del ajuste para una ecuacibn estimada de regresibn. 


13.9 Series de tiempo y autocorrelation 

\ 

En las secciones anteriores se ban examinado los analisis de regresion y de correla- 
cibn con base en una muestra aleatoria de la variable respuesta Y. En muchas situa- 
ciones, por ejemplo en economia y finanzas, la variable respuesta se mide en forma 
periodica con respecto al tiempo. Por ejemplo, puede escogerse examinar la tasa de 
desempleo para los pasados 24 meses, o puede observarse el volumen de ventas tri- 
mestral de alguna compaflia y compararlo con el correspondiente volumen de ventas 
de toda la industria durante los pasados 12 trimestres. Dado que para ambos 
ejemplos las observaciones se registran de manera secuencial con el paso del tiempo, 
forman lo que se conoce como una serie de tiempo. 

Aunque los metodos de regresion pueden ser utiles al analizar datos de series de 
tiempo, las observaciones de Y en una serie de tiempo no pueden considerarse como 
representativas de una muestra aleatoria. De hecho, pueden encontrarse correlacio- 
nadas entre si. Por ejemplo, es probable que el cambio en la tasa de desempleo para 
este mes se encuentre relacionada con la que se observara para el siguiente mes. De 
esta forma, algunas de las suposiciones que son necesarias para el desarrollo de pro- 
cedimientos inferenciales posiblemente no se verifiquen para los datos de una 
serie de tiempo. 

En este contexto se desea considerar un procedimiento inferencial util, conocido 
como estadistica de Durbin-Watson, para determinar si los errores en un modelo* 
lineal sencillo se encuentran correlacionados en el tiempo. Los errores del mismo 
modelo de regresion que se encuentran correlacionados como funciones del tiempo 
reciben el nombre de correlacionados serialmente o autocorrelacionados. Antes de 
analizar el procedimiento de Durbin-Watson, se mencionaran en forma breve los 
componentes usuales de datos de una serie de tiempo. 

13.9.1 Componentes de una serie de tiempo 

Las fluctuaciones de la variable respuesta en una serie de tiempo de tipo economico 
se asignan, por lo general, a cuatro causas diferentes (componentes): la variacion en 
la tendencia T, la variacion por temporada S, la variacion ciclica C y la variacion 
aleatoria R. la variacion en la tendencia es el movimiento a largo plazo en Y. Por 
ejemplo, la produccion de automoviles en Estados Unidos ha mostrado una tenden¬ 
cia hacia el crecimiento durante los ultimos 50 aftos, pero lo anterior no necesaria- 
mente implica que la produccion aumento todos los aftos durante este periodo. De 
esta forma, la tendencia refleja el movimiento general de Y a lo largo de un periodo. 
La variacion por temporada representa el movimiento de Y que ocurre durante pe- 
riodos especificos a lo largo de un aflo. Por ejemplo, el volumen de ventas al menu- 
deo tiende a ser mayor en el ultimo trimestre del aflo que durante el primero. La va- 

* Tambten puede emplearse este procedimiento para el modelo lineal general, el cual se estudiaraen el ca- 
pitulo 14. 
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riacion dclica muestra el movimiento de Y que se repite durante periodos que, en 
general, son mayores de un aflo. Los movimientos dclicos se encuentran muchas 
veces relacionados con las condiciones economicas prevalecientes. Por ejemplo, la 
construction de casas en Estados Unidos disminuyd durante el periodo de recesion 
de 1974-1975; aumento durante el de recuperacidn de 1976-1979 y volvio a disminuir 
en la recesion de 1981-1982. La variacion aleatoria en una serie de tiempo es la fluc¬ 
tuation de Y que no es posible asignar a una causa identificable. Por lo tanto, la 
fluctuackm total de Y con respecto al tiempo se asigna a una variacion sistematica 
(tendencia, temporada y ciclo) y a una variacidn aleatoria. 

Al suponer c6mo se encuentran relacionadas estas componentes, puede formu- 
larse un modelo de una serie de tiempo que ayudara a separar estas componentes y 
formular predicciones con respecto a Y. Los modelos de las series de tiempo usual- 
mente son aditivos de la forma 

Y=T+S+C+R 

o multiplicativos de la forma 

Y=TxSxCxR. 

Para un modelo aditivo se supone que los cuatro componentes son independientes 
entre si, mientras que para el multiplicativo se encuentran relacionados entre si. 
Para tratamientos completos del analisis de las series de tiempo se sugieren las refe- 
rencias [i] y [4]. 

13.9.2 La estadistica de Durbin-Watson 

En esta section el interes radicara, en forma exclusiva, en la detection de errores 
autocorrelacionados y en un analisis con respecto a medidas correctivas. Una de las 
razones de la existencia de la autocorrelacion es que podrian no haberse tornado en 
cuenta en el modelo variables importantes de prediccion. Por ejemplo, se menciono 
que, en general, la produccion de automoviles tuvo un incremento durante un perio¬ 
do de 50 aiios. Si se supone algun modelo de regresion con el tiempo como la unica 
variable de prediccion, no es de dudar que se encontraran correlaciones entre los 
errores. Pero durante el mismo periodo aumento la poblacion asi como el nivel eco- 
nomico de los habitantes de Estados Unidos. Cuando variables de prediccion como 
estas estan positivamente correlacionadas con la produccion de automoviles, pero 
no se toman en cuenta en el modelo de regresion, entonces los errores tenderan a 
estar positivamente autocorrelacionados, ya que tambien reflejan los efectos de las 
variables de prediccion faltantes. Este tipo de autocorrelacion solo es aparente y 
puede eliminarse mediante la inclusion de las variables omitidas en el modelo de re¬ 
gresion. 

En las series de tiempo economicas, la autocorrelacion tambien puede presentarse 
debido a que los residuos sucesivos tienden a estar positivamente correlacionados, es 
decir, los grandes residuos negativos siguen a grandes residuos negativos y los grandes 
residuos positivos siguen a grandes residuos positivos. Este tipo de autocorrelacion es, 
en general, la clase que necesita algun ajuste. El interes recaera en este tipo y se estu- 
diaran las medidas correctivas tales como la transformation de los datos. 
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Recuerdese que por la suposicion 3 de la section 13.2, la covarianza entre los 
errores aleatorios e, y e, es cero para todo / ^ j. A pesar de que esta suposicion no 
es necesaria para obtener los estimadores de minimos cuadrados, su violation afecta 
las propiedades inferenciales de estos estimadores. Cuando se encuentra presente la 
autocorrelacion, el analisis de regresion es afectado en tres formas. 

1. Los estimadores MC, aunque son no sesgados ya no tienen varianza minima. 

2. Los estimados j 2 (R,) pueden subestimar, en forma seria, las varianzas de los esti¬ 
madores MC de B,. 

3. Los intervalos de confianza y las pruebas de hipotesis que incluyen, ya sea la dis¬ 
tribution t de Student o la distribution F, no son teoricamente v&lidas. 

Por ejemplo, supongase que los datos que figuran mis adelante representadas las 
ventas Y de alguna compaftia (en millones de dolares) y las ventas x (tambien en mi- 
llones de dolares) para toda la industria en los pasados 16 trimestres, dondv lo_ datos 
ya se han ajustado de acuerdo con la inflation. 


t 

1 

2 

3 

4 

5 

6 

7 

8 

X, 

270.36 

258.38 

254.96 

259.70 

265.40 

274.98 

281.86 

285.78 

Y, 

i 44.84 

42.97 

41.98 

42.75 

43.95 

45.65 

46.87 

47.35 


t 

9 

10 

11 

12 

13 

14 

15 

16 

x, 

290.58 

290.18 

296.72 

292.32 

301.72 

305.42 

314.% 

321.10 

Y. 

48.13 

47.95 

49.10 

48.52 

50.22 

51.15 

52.78 

53.91 


Una grafica de Y contra x revela una tendencia lineal, lo que a su vez sugiere que las 
acciones de la compania se mantienen en el mercado. Supongase un modelo lineal 
simple como el dado por (13.1). El listado de computadora producido por Minitab, 
se muestra en la figura 13.6 

Notese que parece que el modelo ajusta los datos en forma excelente, ya que F = 
0.997, y se rechaza la hipbtesis nula de pendiente igual a cero para casi cualquier 
nivel a.Las desviaciones estadar estimadas para B 0 y B, son pequeilas, y en forma 
especial para el estimador de la pendiente. Pero al graficar los residuos estandariza- 
dos contra el tiempo, como se muestra en la figura 13.7, se nota que los residuos del 
mismo signo aparecen agrupados. Por ejemplo, los residuos 5-7 son positivos, 8-13 
son negativos y 14-16 son positivos. Este tipo de patron es caracteristico cuando se 
tienen errores autocorrelacionados. 

La estadistica de Durbin-Watson constituye un enfoque mas formal que al grafi¬ 
car los residuos para detectar los errores autocorrelacionados; se basa en la suposi¬ 
cion de que los errores e, en el modelo de regresion 

y, = A, + 0,-r, + e, ( 13 - 30) 

forman una serie autorregresiva de primer orden dada por 

e, = pe,_ 1 + 17 , t » 2 , (13.31) 
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*.( - 



\ 


LA ECUACION DE REGRESION ES 
Y = - 2.97 + 0.177 XI 


COLUMNA COEFICIENTE 

-2.9716 

XI C2 0.176510 


dev. est. 

DEL COEF. 

0.7023 

0.002456 


COCIENTE-T 

COEF/D.E. 

-4.23 

71.86 


LA DEV. EST. DE Y CON RESPECTO A LA RECTA DE REGRESION ES 

S = 0.1919 

CON (16 - 2) = 14 GRADOS DE LIBERTAD 
R-CUADRADO = 99.7 <7o 


ANALISIS DE VARIANZA 


DEBIDO A 

DF 

SC 

CM = 

= SC/GL 


REGRESION 

1 

190.2330 

190. 

2330 


RESIDUO 

14 

0.5157 

0. 

0368 


TOTAL 


15 

190.7487 





XI 

Y 

VALOR 

DEV. EST. 



RENGLON 

C2 

Cl 

PRED.Y 

PRED. Y 

RESIDUO 

RES. EST. 

1 

270 

44.8400 

44.7497 

0.0604 

0.0903 

0.50 

2 

258 

42.9699 

42.6350 

0.0816 

0.3349 

1.93 

3 

255 

41.9800 

42.0314 

0.0886 

-0.0515 

-0.30 

4 

260 

42.7499 

42.8680 

0.0790 

-0.1181 

-0.68 

5 

265 

43.9499 

43.8742 

0.0684 

0.0758 

0.42 

6 

275 

45.6500 

45.5651 

0.0542 

0.0848 

0.46 

7 

282 

46.8699 

46.7795 

0.0487 

0.0904 

0.49 

8 

286 

47.3499 

47.4714 

0.0480 

-0.1215 

-0.65 

9 

291 

48.1299 

48.3187 

0.0497 

-0.1887 

-1.02 

10 

290 

47.9499 

48.2481 

0.0495 

-0.2981 

-1.61 

11 

297 

49.0999 

49.4025 

0.0556 

-0.3025 

-1.65 

12 

292 

48.5200 

48.6258 

0.0510 

-0.1059 

-0.57 

13 

302 

50.2199 

50.2850 

0.0627 

-0.0651 

-0.36 

14 

305 

51.1500 

50.9381 

0.0689 

0.2119 

1.18 

15 

315 

52.7800 

52.6220 

0.0873 

0.1579 

0.92 

16 

321 

53.9100 

53.7058 

0.1002 

0.2042 

1.25 


FIGURA 13.6 Analisis de regresion lineal (datos del mercado de acciones) 


donde |p| < 1 es la pendiente de la recta que pasa por el origen y ?), es el error alea- 
torio puro que no se encuentra correlacionado con cualquier otra componente. El 
termino Vr se denomina de manera comun como ruido bianco. Debe notarse que 
(13.31) es un modelo autorregresivo, ya que la variable de prediction e, es un ter¬ 
mino retardado en el tiempo de la variable respuesta e,. A pesar de que la estructura 
de correlation entre los errores puede ser mas compleja que la implicada por (13.31), 
un modelo autorregresivo de primer orden es una aproximacion razonable, debido a 
que muchas veces la autocorrelation entre e, y e, +/ , disminuye de manera rapida 
conforme la distancia entre los puntos en el tiempo t y t + p aumenta. 
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FIGURA 13.7 Residuos estandarizados contra tiempo para el ejemplo de las ventas 


Para el modelo dado por (13.31), se desea emplear la estadistica de Durbin- 
Watson para probar la hipotesis nula 

H 0 :p = 0 

contra la alternativa 


//,: p > 0 . 


N 6 tese que //, es una hipotesis alternativa unilateral superior, ya que las series de 
tiempo economicas exhiben muchas veces una autocorrelation positiva. La estadisti¬ 
ca de Durbin-Watson se basa en los residuos que resultan despues de obtener la 
ecuacion de regresion estimada para (13.30). Se calcula un valor de esta estadistica a 
partir de la expresion 

n 

2 (e, ~ * V -,) 2 

d = ^-, (13.32) 

/ - i 

donde el residtio es e, = y. - y : . 
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Si los errores se encuentran positivamente autocorrelacionados, es probable que 
los errores adyacentes tengan la misma magnitud. De esta forma, pequeflas diferen- 
cias entre los residuos adyacentes sugieren que p es mayor que cero; pero cuando las 
diferencias son pequeflas, el numerador de (13.32) tambien lo es. De acuerdo con lo 
anterior, se rechaza la hipotesis nula de autocorrelacibn cero siempre que d tiene un 
valor relativamente pequeflo. 

Durbin y Watson tabularon los limites inferior y superior d L y d v , respectiva- 
mente, para probar H 0 . En la tabla K del apendice se proporcionan los limites d L y 
d L , para a = 0.05 y 0.01 como funciones del tamaflo n de la muestra y el numero k 
de variables de prediction en el modelo de regresion. Dados los limites d L y d , , la 
decision para H 0 se toma de la siguiente forma: 

a Si d < d L , rechazar H 0 , 

b Si d > d u , no puede rechazarse , 

c Si d, < d < d v . la prueba no es concluyente. 

Debe seflalarse que la prueba para autocorrelation negativa (f/,: p < 0) tam¬ 
bien es posible con la estadistica de Durbin-Watson. En este caso, el valor de la 
estadi'stica es 4 -d, donde d se calcula de acuerdo con (13.32). El procedimiento de 
decision,es igual al ya dado, comparando 4 - d con d L o dy. En cualquier caso, si la 
prueba es no concluyente, la alternativa que se sugiere es tomar mas observaciones. 

Para el ejemplo se calcula d primero, con lo que se obtienen las diferencias e t - 

i, mediante el uso de la columna de residuos dada en el listado de computado- 
ra. Estas diferencias son las siguientes: 


t 

2 

3 

4 

5 

6 

e, 

~ e,-i 

0.2446 

-0.3864 

-0.0666 

0.1939 

0.0090 


t 

7 

8 

9 

10 

11 

e, 

- *i-i 

0.0056 

-0.2119 

-0.0672 

-0.1094 

- 0.0044 


t 

12 

13 

14 

15 

16 

e, 

~ */ -1 

0.1966 

0.0408 

0.2770 

-0.0540 

0.0463 


Mediante el empleo de (13.32) se obtiene 

d - 0.434789/0.5157 = 0.843. 

Por ejemplo, a = 0.05; entonces para el modelo lineal simple (13.30) y n = 16, 
los limites son d L = 1.10 y d L! = 1.37. Dado que d < d L , se rechaza la hipotesis 
nula y se concluye que existe una razbn para creer que los errores en (13.30) se en¬ 
cuentran autocorrelacionados. 
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13.9.3 Eliminaci6n de la autocorrelacidn mediante 
la transformacidn de datos 

Cuando se rechaza la hipdtesis nula de autocorrelacidn cero, debe ajustarse la 
ecuacidn estimada de regresidn para compensar la presencia de errores autocorrela- 
cionados. A continuacidn se mostrara un enfoque debido a Cochrane y Orcutt.* Se 
basa en un metodo iterativo el cual incluye la transformacidn de las variables res- 
puesta y prediccidn en el modelo original de regresidn. 

Para el modelo dado por (13.30), considerese la transformacidn 

Y', = Y, -pY..,. (13.33) 

A1 sustituir en (13.33) Y, y K f _,, de acuerdo con (13.30), se tiene que 
Y', = (A, + P\*, + e,) - p() 3 0 + A*/-, + e /-i) 

= Pod - p) + P,(x, - pjr,_|) + (e, - pe,_,). 


Pero de (13.31) 

e, - pe,_, = 17 , 

donde 17 , son errores aleatorios no correlacionados. Entonces 

y> = Pod - p) + Pi(x, - px :,_,) + 77 ,, 
o 

Y, = Po + P\x', + 77 ,, (13.34) 

donde A = AO - p), P\ = P\.y x' t = x, - px De acuerdo con lo anterior, 
los errores en el modelo lineal simple transformado (13.34) no estan correlacionados 
entre si, y de esta forma este modelo satisface las suposiciones estandar. 

Ndtese que las observaciones transformadas Y', - K, - pK,_, y x\ = x, - 
px 1 son funciones de la autocorrelacidn desconocida p, asi que antes de ajustar el 
modelo transformado debe obtenerse un estimador de p. Lo anterior puede hacerse 
mediante el empleo de los residuos obtenidos de la ecuacion de regresion estimada 
originalmente para calcular un estimador MC de la pendiente p en el modelo auto- 
rregresivo de primer orden dado por (13.31). Ya que este modelo tiene una intersec- 
cion igua! a cero, el estimador MC, r de la pendiente p basado en el analisis de la 
seccion 13.3, es 


n 


2 e,-,e, 

r — f 



r= I 


(13.35) 


*D. Cochrane y G. H. Orcutt, Application of least squares regression to relationships containing autocorrelated 
error terms, J. Amer. Statistical Assoc. 44 (1949), 32-61. 
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y los valores transformados son 

>'< = y> ~ ry '~" (13.36) 

x', = x, - rx ,_ i. 

Dados los valores transformados para las variables de respuesta y predicci 6 n, el 
procedimiento iterativo consiste en determinar la ecuacion de regresion estimada 
para el modelo transformado y entonces volver a calcular la estadistica de Durbin- 
Watson. Si no es posible rechazar la hipbtesis nula de autocorrelation cero, el proce¬ 
dimiento llega a su fin. De otra forma, se repite hasta que H 0 no pueda rechazarse. 
Si se requiere mas de una iteracibn, entonces se sugiere buscar otros procedimientos 
alternatives. 

Como ejemplo, el estimado MC de p para el ejemplo de las ventas es 
r = O.z/34/0.5157 = 0.53, 
y los valores transformados son los siguientes: 


t 

2 

3 

4 

5 

6 

7 

8 

9 

x\ 

r f 

115.09 

19.20 

118.02 

19.21 

124.57 

20.50 

127.76 

21-29 

134.32 

22.36 

136.12 

22.68 

136.39 

22.51 

139.12 

23.03 

t 

10 

11 

12 

13 

14 

15 

16 


x', 

y; 

136.17 

22.44 

142.92 

23.69 

135.06 

22.50 

146.79 

24.50 

145.51 

24.53 

153.09 

25.67 

154.17 

25.94 



El listado de computadoras que se obtiene mediante el empleo de Minitab* para 
el modelo transformado se muestra en la figura 13.8. Notese que el listado tambien 
incluye el valor de d = 1.61 para la estadistica de Durbin-Watson; Minitab propor- 
ciona este valor como parte del listado. Para n = 15 y a = 0.05, se obtienen los li- 
mites d L = 1.08 yt/(, = 1.36 al consultar la tabla/f. Dado que d > d v , no es po¬ 
sible rechazar la hipbtesis nula de autocorrelacibn cero. 

Ahora, es necesario escribir la ecuacion de regresibn estimada en terminos de las 
variables originales y ajustar las desviaciones estandar estimadas de B 0 y B, para re- 
flejar la eliminacion de los errores autocorrelacionados. Dado que A', - /l 0 d - p) 
y P'i = Ai, los estimadores MC de /3 0 y A son 

b o 

y 

b x 


t> 0 


1.5178 


(1 - r) (1 - 0.53) 


= -3.2294, 


= b\ = 0.1774. 


* Se ha omitido una porcion del listado que incluye los valores de las variables de respuesta y prediccibn, 
residuos, etc. 
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LA ECUACION DE REGRESION ES 

Y = -1.52 + 0.177 XI 



COLUMNA 

COEFICIENTE 

DEV. EST. 
DEL COEF. 

COCIENTE-T = 
COEF/D.E. 


— 

-1.5178 

0.5176 

-2.93 

XI 

C2 

0.177407 

0.003784 

46.88 


LA DEV. EST. DE T CON RESPECTO A LA RECTA DE REGRESION ES 
S = 0.1627 

CON (15 - 2) = 13 GRADOS DE LIBERTAD 
R-CUADRADO = 99.4% 

ANALISIS DE VARIANZA 

DEBIDA A DF 
REGRESION 1 
RESIDUO 13 

TOTAL 14 

ESTADISTICA DE DURBIN-WATSON =1.61 


SC 

58.16086 
0.34401 
58.50485 


CM = SC/GL 
58.16086 
0.02646 


F1GURA 13.8 Analisis de regresion lineal despues de la transformation de los datos por 
autocorrelation 


Para los estimadores B' 0 y B J del listado de la figura 13.8, se nota que sus desvia- 
ciones estandar estimadas son s(B’ 0 ) = 0.5176 y s(B[) = 0.003784. Por lo 
tanto, para las desviaciones estandar estimadas de B 0 y B,, se tiene 


s(B 0 ) = s 


Bp 

(1 - r) 


= s(Bo)/{ 1 - r) = 1.1013, 


s(B,) = s(B i) = 0.003784. 


En la tabla 13.7 se encuentra un resumen de la information pertinente para las ecua- 
ciones de regresion estimadas original y final para los datos de ventas. Notese que a 
pesar de que el cambio en los valores estimados de los coeficientes es pequefio, existe 
un considerable aumento en las desviaciones estandar estimadas de B 0 y B t , y en 


TABLA 13.7 Resumen de la information para los datos de ventas 


Ecuacion original estimada 

Ecuacion final estimada 

y, = - 2.9716 + 0.1765.C, 

v, = - 3.2294 + 0.I774.V, 

s(B„) = 0.7023, s(B,) = 0.002456 

s(B u ) = 1.1013. s(B,) = 0.003784 

CME = 0.0368 

CME = 0.0265 

r 2 = 0.997 

r = 0.994 
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forma especial para B r Pero la varianza residual ( CME) ha disminuido. En este 
ejemplo, la autocorrelation aparente no fue lo suficientemente fuerte como para 
causar diferencias sustanciales en la inferencia. Cuando ocurre lo contrario, es pro¬ 
bable que se noten diferencias muy drasticas. 


13.10 Enfoque matricial para el modelo lineal simple 

El uso del algebra de matrices proporciona un medio conveniente para el analisis de 
regresion de modelos lineales, en forma especial de aquellos que contienen mas de una 
variable de prediction. Se ilustrara el uso del algebra de matrices mediante el examen 
del modelo lineal simple. Para una breve revision de los fundamentos del algebra de 
matrices, se invita al lector a que consulte el apendice que se encuentra al final de este 
capitulo. 

Para los n pares (a, , P,), ( x 2 , P;), .... (x„, Y„), el siguiente modelo lineal simple 

Y , = A> + fi\X, + e, / = 1, 2 . n. 

En otras palabras, 

Y\ — Po + /5|At | + £ | 

Y 2 — A) /3 1-^2 + b 2 



13.10 Enfoque matricial para el modelo lineal simple 489 

Si se supone el caso de la teoria normal, entonces e es un vector de variables aleato- 
rias normales, tal que 

E(e) = 0, 

Var(e) = cr 2 I 

donde cr 2 es la varianza del error, comun a todos ellos, e I es la matriz de identidad 
correspondiente. 

Ahora, considerese la estimacibn de minimos cuadrados de A> y /?,. Recuerdese 
que las ecuaciones normales estan dadas por (13.4). Dado que 



Por lo tanto, las ecuaciones normales en forma matricial son 


donde 


(X'X)B = X'Y, 


(13.40) 



es el vector que contiene los estimadores de minimos cuadrados B t) y B,. 

Si se supone que la matriz cuadrada X'X tiene inversa, entonces en (13.40) 

(X'X) '(X'X)B = (X'X)-'X'Y. 
o 

IB = (X'X) ‘X'Y, 
y 

B = (X'Xr'X'Y (13.41) 

es la expresion matricial para obtener los estimadores de minimos cuadrados B u y B 
A1 emplear los datos correspondientes al ejemplo de salarios inciales, se ilustrara 
que la expresion dada por (13.41) proporciona los mismos estimadores de minimos 
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cuadrados para /?,> y /3i obtenidos con anterioridad. El vector Y de salarios iniciales 
y la matriz X correspondiente a las calificaciones promedio son 



"18.5“ 


"1 

2.95“ 


20.0 


1 

3.20 

Y = 

21.1 

, x = 

1 

3.40 


16.8 


1 

2.15 _ 


El lector debe notar que los numeros uno que se encuentran en la primera columna 
de X representan la intersection /3 0 definida de acuerdo con el modelo lineal simple 
propuesto. A1 seguir con el calculo se tiene 


y 


(X'X) 


"1 1 

.2.95 3.20 


X'Y 


'1 I 

_2.95 3.20 


1 

2.75 


2.95“ 

3.20 


'15 45.6 “ 

.45.6 139.51. 


I 

2.75 


I 

2.15 _ 

1 


“18.5“ 



20.0 


270.8 




830.425. 


16.8 



La inversa de la matriz de 2 x 2 es igual a 

139.51 -45.6 

-45.6 15 _ 


(x'xr 


13.29 


Para evitar la posibilidad de graves errores por redondeo, lo mejor es no dividir 
cada elemento de (X'X) -1 por el valor 13.29 hasta que se efectue el producto (X'X) 
'X'Y. Entonces, de (13.41) los estimadores de minimos cuadrados son 


1 

139.51 

-45.6' 

'270.8 

13.29 

.-45.6 

15 _ 

.830.425. 


1 

‘-88.072" 


'-6.6269' 

13.29 

107.895. 


8.1185. 


o b 0 = -6.6269 y b, = 8.1185. A1 redondear a dos digitos significativos, estos 
valores son iguales a los ya obtenidos con anterioridad. 
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Ejercicios 

13.1. Formulese un comentario con respecto a la causalid-’d p^a las siguientes situaciones: 

a) Durante los pasados 12, c.e 15 aflos, el mercado de valores credo cuando el prome- 
dio global de la liga mayor de beisbol disminuyo y viceversa. 

b) Desde el primer Super Tazon en 1967, el mercado de valores aumento durante todos 
los afios en los que el equipo que ganaba el Super Tazon provenia de la vieja Liga 
National de futbol, y disminuyo durante los anos en lo que el campeon era un 
equipo de la vieja Liga Americana de futbol. 

13.2. De los siguientes modelos, icuales son lineales? 

a. Y = 1 3 sen(x) + e 

b. Y = /3, sen (fi 2 x) + e 

c. y = A) + Pix]x 2 + fi 2 x 2 + e 

d. Y = /3 0 + tfx + e 

13.3. Dado el modelo lineal T, = /3 jc, + e,, i = 1, 2, ..., n, supongaseque £(e,) = 0, 
Vur(ej) = a 2 para toda i y Cov(e,, e,) = 0 para toda i f j. 

a) Obtengase el estimador B de minimos cuadrados para (3. 

b) Determinese si B es un estimador no sesgado de P, y demuestrese que Var(B) = o- 2 

/2.r 2 . 

13.4. Una compaflia local de energia selecciono una residencia tipica para desarrollar un mo- 
delo empirico para el consumo de energia (en kilowatts por dia) como una funcion de 
la temperatura promedio diaria durante los meses de invierno. Se obtuvo la siguiente 
information durante un periodo de 15 dias. 


Temperatura (°C) 

0 

8 

7.5 

13.5 

14 

8.5 

4.5 

- It 

Consumo de 

70 

57 

60 

63 

57 

66 

67 

107 

energia 

Temperatura (°C) 

-7.5 

-8.5 

1.5 

0.5 

2 

-6 

-4 


Consumo de energia 

96 

88 

80 

64 

79 

82 

97 



a) Grafiquense los datos. ^Sugiere la grafica una asociacion lineal? 
bf Para un modelo lineal simple, obtengase la ecuacion estimada de regresion y grafi- 
quese sobre la grafica de la parte a. 
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c) Interpretense Ios coeficientes de regresion estimados. 

d) iQue se recomendaria a la compaflia para mejorar el modelo emplrico? 

13.5. Una compaflia de seguros desea determinar el grado de relacion que existe entre el ingre- 


so familiar x y el monto del seguro de vida Y del jefe de familia. Con base en una muestra 
aleatoria de 18 familias, se obtuvo la siguiente information (en miles de dolares). 

Ingreso 

45 20 

40 

40 

47 

30 

25 

20 

15 

Seguro de vida 

70 50 

60 

50 

90 

55 

55 

35 

40 

Ingreso 

35 40 

55 

50 

60 

15 

30 

35 

45 

Seguro de vida 

65 75 

105 

110 

120 

30 

40 

65 

80 


kepitanse todos los incisos del ejercicio 13.4. 

13.6. Dada la ecuacion de regresion estimada para el ejeidcL 13.4: 

a) Calculense los residuos. 

b) Verifiquese que se cumplen las propiedades 2 y 3 de la seccion 13.3. 

c) Obtengase la varianza residual. 

d) Calculense los estimadores de las desviaciones estandar de B„ y B,. 

e) Obtengase un intervalo estimado de confianza del 95% para el valor real de la pen- 
diente. 

f) Determinese si una relacion lineal entre la temperatura atmosferica promedio y el 
consumo de energia es estadisticamente discernible para un nivel a = 0.05 

g) Para cada temperatura atmosferica, calculense los intervalos de confianza del 95% 
estimados para el uso medio de energia y grafiquense estos contra la recta estimada 
de regresion. 

13.7. Repitanse todos los incisos del ejercicio 13.6para la ecuacion de regresion estimada del 
ejercicio 13.5. 

13.8. Con respecto al ejercicio 13.4, estimense los consumos individuales de energia para las 
siguientes temperaturas:- 10, -8, -5, -2, 1,4, 7, 10. y 13. Obtenganse intervalos 
de prediccion del 95% para las estimaciones. 

13.9. Con respecto al ejercicio 13.5, estimense los montos individuales del seguro de vida 
para los ingresos anuales de 18, 28, 38, 48 y 58 y obtenganse intervalos de prediccion 
del 95% para sus estimaciones. 

13.10. Mediante el empleo de los datos de los ejercicios 13.4 y 13.5 

a) Llevese a cabo un analisis de varianza para cada conjunto de datos y determinese si 
se puede rechazar la hipotesis nula de no regresion lineal a un nivel dea = 0.05. 

b) Comparense los resultados de la parte a con los que se obtienen en la parte /del 
ejercicio 13.6. Formulese un comentario sobre la relacion entre el valor de la esta- 
distica F, calculado aqui, con el de la estadistica T determinado en la parte / del ejer¬ 
cicio 13.6. 

c) Calculense los coeficientes de determination y expliquese su significado. iPuede 
concluirse que las verdaderas ecuaciones de regresion entre la temperatura y el con¬ 
sumo de energia, o entre el ingreso anual y el monto del seguro de vida, son estricta- 
mente lineales? 
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13.11. Los siguientes datos son las alturas X y los pesos Y de una muestra aleatoria de 10 em- 
pleados del sexo femenino de una gran empresa. 

Altura (pulgadas) 68 67 65 68 64 67 66 65 64 66 

Peso (libras) 119 118 129 135 123 140 125 132 118 130 


a) Grafiquense los datos. 

b) Calculese el coeficiente de correlacion de la muestra y formulese un comentario 
sobre cualquier linealidad aparente entre la altura y el peso. 

13.12. Los siguientes datos* representan la potencia diaria, en megawatts, generada por una 
central electrica de servicio regional, durante el mes de agosto de 1980, y la temperatu- 
ra atmosferica en grados Fahrenheit registrada a las 11 a.m. en una localidad central. 


Temperatura 

99 

99 

99 

99 

99 

96 

% 

97 

97 

Potencia 

153.4 

141.0 

143.1 

156.8 

158.7 

158.5 

158.7 

159.6 

148.3 

Temperatura 

97 

99 

94 

9' 

97 

96 

85 

79 

76 

Potencia 

137.8 

160.0 

154.0 

142.2 

149.4 

147.9 

114.2 

94.7 

112.5 

Temperatura 

84 

90 

76 

78 

81 

90 

93 

90 

96 

Potencia 

123.6 

131.1 

119.4 

111.9 

103.5 

103.7 

125.4 

129.0 

135.6 

Temperatura 

| 98 

95 

95 

95 






Potencia 

142.3 

142.5 

128.9 

124.3 







a) Grafiquense los datos. 

b) Calculese el coeficiente de correlacion de la muestra y formulese un comentario 
sobre cualquier linealidad aparente entre la temperatura y la cantidad de potencia 
generada. 

13.13. Supongase que se sabe que la curva de regresion entre una respuesta Y y una variable 
de prediction x es lineal. Para estimar la ecuacion de regresion, se toman n/2 observa- 
ciones de Y en el extremo inferior del intervalo de valores de x y n/2 observaciones en 
el extremo superior de x. Por conveniencia, los valores extremos de x se han escalado a 

- 1 y + 1. 

a) Empleese la ecuacion (13.18) para obtener el intervalo para la varianza de la res¬ 
puesta media para cualquier punto x p de x que se encuentre dentro del intervalo 
(- 1 . 1 ). 

b) Usese la ecuacion (13.20) para obtener una expresion similar para la varianza de una 
respuesta en particular. 

c) Supongase que se registran las siguientes observaciones: 

.< -I -I -1 -I -I I 1 I 1 I 

Y 10 12 9 13 8 20 17 23 24 19 


* Cortesia de K. L. Fugett. 
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Usese algebra de matrices para obtener las estimaciones de minimos cuadrados para 
la pendiente y la interseccibn. 

13.14. Supongase que la siguiente informacidn sobre el ingreso anual bruto x y el porcentaje 
de impuestos pagados Y, proviene de una muestra aleatoria de 14 declaraciones de im- 
puestos. 


Ingreso bruto 
(miles de dolares) 

25.6 

42.2 

57.6 

98.8 

10.4 

30.1 

40.0 

Porcentaje pagado 
en impuesto 

15.4 

16.8 

19.7 

21.7 

10.8 

15.2 

18.9 

Ingreso bruto 
(miles de dolares) 

29.3 

16.1 

18.0 

88.2 

34.0 

22.1 

70.0 

Porcentaje pagado 
en impuesto 

15.9 

12.0 

14.1 

21.1 

17.6 

14.8 

21.6 


a) Grafiquense los datos. (.Sugiere esta grafica una asociacion lineal? 

b) Mediante la suposicion de un ajuste lineal, estimese la ecuacion de regresion y dibu- 
jese la recta sobre la grafica de la parte a. 

c) Realicese un analisis de varianza, obtenganse los coeficientes de determination y co- 
mentese si se puede pensar que la ecuacion de regresion estimada proporciona una 
prediction apropiada. Usese a = 0.05. 

d) Predigase el porcentaje promedio de impuestos que pagara la gente con ingresos 
brutos de 15 y 85 mil d61 ares y obtenganse las estimaciones de sus desviaciones es- 
tandar. 

13.15. El gerente de una industria desea determinar si existe una relation lineal entre el nume- 
ro de unidades Y, armadas por los operadores de una linea de ensamble, y el lapso x 
que transcurre antes de que se presente una falla. Con base en una muestra aleatoria de 
operadores de la linea de ensamble, se observa la siguiente information: 


Tiempo (en horas) 

12 3 4 

Unidades ensambladas 

25,29,23,31 55,65,63,59 73,75,74,71 90,88.91,87 


a) Grafiquense los datos y comentese el resultado. 

b) Estimese una ecuacion de regresion lineal mediante el uso del algebra de matrices. 

c) Determinese si la relation lineal es estadisticamente discernible para un nivel a = 0.01 

d) Obtengase un intervalo de confianza del 95% para ia pendiente. 

13.16. Los siguientes datos muestran el porcentaje de la poblacion con cuatro o mas afios de 
education superior x, y la tasa de mortalidad infantil por cada 1 000 nacimientos Y 
para una muestra de 15 estados.* 

a) Grafiquense los datos y calculese el coeficiente de correlation de la muestra. 

b) Ajustese una funcion de regresion lineal con la tasa de mortalidad como la respues- 
ta y el porcentaje de la poblacion con cuatro o mas afios de education superior 
como la variable de prediction, lnterpretese el coeficiente de regresion estimado 
para la pendiente. 

* Hammond almanac, 1981. 
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X 

19.4 

12.3 

13.7 

11.0 

11.5 

16.8 

11.8 

12.8 

Y 

12.0 

15.4 

16.0 

14.2 

17.9 

11.9 

14.2 

12.7 


X 

15.3 

11.8 

11.7 

10.4 

17.5 

15.6 

16.1 

Y \ 

13.8 

15.8 

13.7 

17.6 

10.1 

10.1 

12.1 


c) La regresibn lineal, ies estadisticamente discernible para un nivel a = 0.05 <,C6mo 
podria explicarse cualquier asociaci6n lineal que existiese entre estas dos cantida- 
des? 

13.17. Los datos* que figuran en la tabla 13.8 consisten en information anual sobre los pre- 
cios relativos del alcohol x y el consumo per capita en litros de alcohol absoluto Y para 
el periodo 1948-1967 en Ontario. 

a) Grafiquense los datos y calculese el coeficiente de correlacibn de la muestra. 

b) Mediate el empleo del analisis de varianza, determinese si la legresion lineal entre 
el precio relativo y el consumo per capita es estadisticamente discernible para un 
nivel a = 0.01 

13.18. Se llevo a cabo un estudio para determinar la relation entre el numerode aft os de expe¬ 
rience a x y el salario anual Y para una profesion en particular en una region geografi- 
ca dada. Se selecciono una muestra aleatoria de 17 personas, las cuales ejercen esta 
profesion, y se obtuvo la siguiente information: 


TABLA 13.8 Datos de la muestra para el ejercicio 13.17 


Aho 

Precio 

relativo 

Consumo 
per capita 

1948 

0.057 

7.09 

1949 

0.058 

7.18 

1950 

0.055 

7.23 

1951 

0.052 

7.23 

1952 

0.051 

7.32 

1953 

0.055 

7.64 

1954 

0.056 

7.73 

1955 

0.047 

7.55 

1956 

0.045 

7.91 

1957 

0.044 

7.86 

1958 

0.043 

7.% 

1959 

0.043 

7.77 

1960 

0.043 

8.14 

1961 

0.043 

8.14 

1962 

0.041 

8.23 

1963 

0.040 

8.46 

1964 

0.039 

8.73 

1965 

0.038 

8.77 

1966 

0.039 

9.18 

1967 

0.035 

8.91 


* R.E. Popham, W. Schmidt, y J. de Lint, The prevention of alcoholism: Epidemiological studies of 
the effects of government control measures, Brit. J. of Addiction 70 (1975), 125—144. 


www. FreeLibros. com 



496 Analisis de regresion: el modelo lineal simple 


Afios de experiencia 

13 

16 

30 

2 

8 

31 

19 

20 1 

Salario anual actual 
(miles de ddlares) 

26.1 

33.2 

36.1 

16.5 

26.4 

36.4 

33.8 

36.5 16.9 

Afios de experiencia 

4 

27 

25 

7 

15 

13 

6 

10 

Salario anual actual 

19.8 

36.0 

36.5 

21.4 

31.0 

31.4 

19.1 

24.6 


(miles de ddlares) I 

a) Grafiquense los datos y, con base en esta grafica, determinese si un ajuste lineal es 
suficiente. 

b) Ajustese un modelo lineal e interpretense los coeficientes de regresion estimados. 

c) iPuede rechazarse la hipotesis nula de pendiente cero para un nivel a - 0.01? 

d) Estimese el salario promedio para una persona que ejerce esta profesion, la cual 
tiene 12 afios de experiencia; ademas, calculese un intervalo de confianza del 99 °7o 
para este valor. 

e) Ob'enganse los residuos y grafiquense contra los correspondientes ailos de expe¬ 
riencia, £se observa algo fuera de lo comun? Expliquese. 

13.19. Los siguientes datos representan el producto nacional bruto x y los gastos de consumo 

Y en miles de millones de dolares en 1972, para los ailos 1960-1980.* 


Afio 

I960 

1961 

1962 

1963 

1964 

1965 

1966 

X 

737.2 

756.6 

800.3 

832.5 

876.4 

929.3 

984.8 

Y 

452.0 

461.4 

482.0 

500.5 

528.0 

557.5 

585.7 

Afio 

| 1967 

1968 

1969 

1970 

1971 

1972 

1973 

X 

1011.4 

1 058.1 

1 087.6 

1 085.6 

1 122.4 

1 185.9 

1 255.0 

Y 

602.7 

634.4 

657.9 

672.1 

696.8 

737.1 

768.5 

Afio 

1974 

1975 

1976 

1977 

1978 

1979 

1980 

X 

1 248.0 

1 233.9 

1 300.4 

1 371.7 

1 436.9 

1 483.0 

1 480.7 

Y 

763.6 

780.2 

823.7 

863.9 

904.8 

930.9 

935.1 


a) Ajustese un modelo lineal e interpretense los coeficientes de regresion estimados. 

b) Hagase una grafica de los residuos estandarizados contra el tiempo. iSe puede de- 
tectar algun patrbn? 

c) Calculese la estadistica de Durbin-Watson y determinese si los errores se encuentran 
positivamente autocorrelacionados. Usese a = 0.05. 

d) Si la autocorrelation positiva es estadisticamente discernible, ajustese la ecuacidn 
de regresion estimada mediante la transformation de los datos. 

13.20. Los siguientes datos representan las ganancias de las empresas por inventario y ajustes 
al capital x y los impuestos sobre estas ganancias Y en miles de millones de dolares para 
los afios 1960-1980.* Repitanse todas las partes del ejercicio 13.19. 


Afio 

I960 

1961 

1962 

1963 

1964 

1965 

1966 

X 

47.6 

48.6 

56.6 

62.1 

69.2 

80.0 

85.1 

Y 

22.1 

22.8 

24.0 

26.2 

28.0 

30.9 

33.7 


* Economic report of the president february 1982. 
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Aflo 

1967 

1968 

1969 

1970 

1971 

1972 

1973 

X 

82.4 

89.1 

85.1 

71.4 

83.2 

96.6 

108.3 

Y 

32.5 

39.2 

39.5 

34.2 

37.5 

41.6 

49.0 

Aflo 

1974 

1975 

1976 

1977 

1978 

1979 

1980 

JC 

94.9 

110.5 

138.1 

164.7 

185.5 

196.8 

182.7 

Y 

51.6 

50.6 

63.8 

72.6 

83.0 

87.6 

82.3 


APENDICE 


Breve revision del algebra de matrices 

Una matriz es un arreglo rectangular de elementos en renglones y columnas. Por 
ejemplo, 


*11 *12 X\j X\n 

*21 *22 X 2 j ■■■ X 2n 



es una matriz que contiene m renglones y n columnas. Las entradas x, h i = 1,2,..., 
m, j = 1, 2, ..., n, son los elementos de la matriz X. El primer indice (r) identifica 
el renglon en el que se encuentra el elemento, y el segundo (J) la columna a la que 
pertenece. La matriz X de m renglones y n columnas se conoce como una matriz de 
orden (o dimension) m por n. En general, una matriz se denota por una letra mayus- 
cula en negritas, mientras que la correspondiente letra minuscula designa a un elemen¬ 
to de esta. Es una practica comun utilizar la siguiente notacion abreviada: 


X = / = 1,2, ..., m, j=l,2,...,n 


para designar a la matriz X de dimension m x n, 

Una matriz que contiene s61o una columna recibe el nombre vector columna, y 
una matriz formada por un renglon vector rengldn. Las matrices 


3’i 


Y = 


y2 



Z' = [z, z 2 


Z n ] 


son ejemplos de vectores columna y renglon, respectivamente; Y es un vector colum¬ 
na de n X 1, y Z' es un vector renglbn de 1 X n. La razon para emplear el simbolo 
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de virgulilla en el vector rengl 6 n Z' se explicara en forma breve. Ya que un vector co- 
lumna o renglbn tienen s61o un rengl 6 n o una sola columna, unicamente es necesario 
usar una notation para identificar la position de los elementos. 

Una matriz que tiene el mismo numero de renglones que de columnas recibe el 
nombre de matriz cuadrada. 



-2 1 
2 4 
1 5 



son ejemplo de matrices cuadradas. A es una matriz cuadrada de 3 x 3, y B es una 
matriz cuadrada de 2 x 2 . 

El intercambio de los renglones y las columnas de una matriz X de m X n da ori- 
gen a una nueva matriz denocada por X', de dimension n x m que recibe el nombre 
de transpuesta de X. Por ejemplo, dada la matriz 



la transpuesta de X es la matriz cuya primera columna es igual al primer renglbn de 
X y cuya segunda columna es igual al segundo renglbn de X, 


En general, dada 



X = [x fV ], i ~ 1, 2. m, 7 = 1,2, 

se tiene 

X' = [Xjj], 7=1.2, / = 1,2, 

En otras palabras, el elemento en el /-esimo renglbn y lay-esima columna de X se en- 
cuentra en el y-esimo renglbn y la /-esima columna de la matriz transpuesta X'. La 
transpuesta de un vector columna es un vector renglbn y viceversa. Por esta razbn se 
acostumbra emplear el simbolo de virgulilla para denotar un vector renglbn. 

Se dice que dos matrices son iguales solo si sus correspondientes elementos son 
iguales. De esta forma, una condicibn necesaria para que dos matrices sean iguales 
es que tengan la misma dimension. Por ejemplo, las dos matrices 



a i. 

a n 


" - 2 

0 " 

A = 

«2I 

_«3I 

an 

an. 

B = 

5 

12 

6 
- 5 


son iguales si 


a n = 

-2 

a 12 = 

0 

« 2 I = 

5 

a 22 = 

6 

«31 = 

12 

a i2 = 

-5. 
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La suma o diferencia entre dos matrices s61o es posible cuando sus dimensiones 
son las mismas. La suma (diferencia) de dos matrices es una matriz cuyos elementos son 
las sumas (diferencias) de los correspondientes elementos de las dos matrices. Por 
ejemplo, dadas 

A = r -2 5 i R _ [4 -3" 

[ 3 8J ’ [2 - 6 J’ 

a + b =[- 2 + 4 5 - 3 U 2 2 

[3 + 2 8 - 6_| |_5 2J ’ 

T-2- 4 5 - (-3)1 = [-6 8' 

[3-28- (-6)J [ 1 14 ’ 

Dadas dos matrices A y B, la matriz producto AB se define solo si el numero de 
columnas de A es igual al numero de renglones de B. Entonces, si A es de m x n y B 
es de n x p, el producto AB es una matriz de dimension m x p para la que el ele- 
mento que se encuentra en el /-esimo renglon y la y-esima columna es igual a la su¬ 
ma de los productos de los elementos que se encuentran en el /-esimo renglon de A y 
lay'-esima columna de B. Si 



1 - 2 1 f-2 ll r OK-2) + (— 2)(4) (l)(l) + (-2X3) 

AB = -3 4 Z = (— 3)( — 2) 4- (4)(4) (-3)(l) + (4)(3) 

0 — 1J L J J L (0)(-2) + (-1)(4) (0)(1) + (-1)(3). 

-10 -5 

22 9 

-4 -3 



Notese que para este par de matrices el producto BA no esta definido; en general, la 
multiplication de matrices no es conmutativa. Tambien es interesante notar que si Y 
es un vector columna de n x 1 y Y' es un vector renglon de 1 x n, entonces YY' es 
una matriz cuadrada de dimension n y Y'Y es un escalar. Un escalare s cualquier nu¬ 
mero de la recta real (-^s x ). La multiplication de una matriz por un escalar da 
origen a una matriz cuyos elementos son los productos de los correspondientes ele¬ 
mentos originales y la cantidad escalar. Por ejemplo, dada 



- 5A = 


(— 5)( — 2) 

(-5X1) 

(— 5)( - 2) 

10 -5 10 

(-5)(3) 

(-5)(4) 

(-5X1) 

-15 -20 -5 
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Existen ciertas matrices especiales que vale la pena mencionar. Una matriz cua- 
drada de dimensidn n cuyos elementos son cero excepto los que se encuentran sobre 
la diagonal principal,* elementos iguales a uno, recibe el nombre de matriz identidad 
de orden n. Por ejemplo. 



I = 


1 0 
0 1 
0 0 


0 

0 

1 


son matrices identidad de orden 3 y 2, respectivamente. En la multiplication de ma¬ 
trices cuadradas, la matriz identidad juega el mismo papel que el numero 1 tiene en 
la multiplicaci6n entre escalares. Esto es, dada cualquier matriz A, el producto de la 
correspondiente matriz identidad y A da como resultado la matriz A, siempre que 
exista compatibilidad para llevar a cabo la multiplicacidn. De esta forma. 


IA = AI = A. 


Se dice que una matriz cuadrada es simetrica, si es igual a su transpuesta. Dada 
cualquier matriz cuadrada A, si A = A', entonces A es simetrica. Por ejemplo. 


A = 


2 

1 

-2 


1 -2 
4 3 

3 1 


es una matriz simetrica. N6tese que los elementos que se encuentran formando un 
triangulo por debajo de la diagonal principal son identicos a los correspondientes en 
el triangulo que se encuentra por encima de la diagonal principal. Si una matriz A de 
m x n se premultiplica por su transpuesta, la matriz producto sera simetrica. De 
esta forma, A'A es una matriz simetrica de orden n. Por ejemplo, dadas 


A = 


2 

1 

3 


1 

4 

2 


A' 


2 1 3 
14 2 ’ 


A'A 


2 1 
1 4 


2 1 
1 4 

3 2 


14 12 

12 21 


Una matriz diagonal es cualquier matriz cuadrada para la que todos los elemen¬ 
tos que se encuentran fuera de la diagonal principal son cero. 


A = 


4 

0 

0 


0 0 
3 0 
0 7 


es una matriz diagonal. Debe ser evidente que la matriz identidad es un caso especial 
de una matriz diagonal. 


* La diagonal principal contiene los elementos cuyas posiciones en el renglon y la columna son las mis- 
mas. 
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Un vector cero es cualquier vector columna para el que todos sus elementos son 
cero. 


0 

0 

0 

0 


es un vector cero de 4 x 1. 

A continuation se define un concepto importante en el algebra matricial, que se 
conoce como la inversa de una matriz cuadrada. Sea A una matriz cuadrada de 
orden n. Si existe una matriz denotada por A- 1 , tal que 

A"'A = AA“‘ = I 

donde I es la correspondiente matriz ide..tidad, entonces A" 1 es la unicamatriz in¬ 
versa de A. Si ”na matriz cuadrada tiene inversa, se dice que es no singular, de otra 
forma, recibe el nombre de matriz singular. 

Para cada matriz cuadrada, es posible definir y calcular una cantidad escalar que 
se conoce como el determinants de la matriz. El valor del determinante de una matriz 
cuadrada es el factor para decidir si esta tiene o no inversa. Sea A cualquier ma¬ 
triz cuadrada. Si el determinante de A, denotado por det(A) no es igual a cero, existe 
la matriz inversa de A. Si det(A) = 0, entonces A es singular. La nocibn de una 
matriz inversa es el analogo del inverso multiplicativo en el algebra de escalares. 

Como ilustracion, se encontrar& la inversa de matrices s61o para el caso de 2 x 2. 
En general, sea 



cualquier matriz de 2 x 2. El determinante de A se define como 


det(A) — Un a 22 a\ 2 a 2 < 


y puede demostrarse que la matriz inversa de A esta dada por 


Por ejemplo, dada 


A-' = 


a 2? a ,2 

det(A) det(A) 

a 2 1 «n 

det(A) det(A) 


det(A) = (2)(1) - (-1)(3) - 5, 
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es la matriz inversa de A. Este resultado puede verificarse en forma sencilla, ya que 


A’ ‘A 



2 3] [l/5 -3/5] [l O' 

-1 lj [l/5 2/5J [0 i ‘ 


Para finalizar, debe notarse que la inversa de cualquier matriz diagonal tambien 
es una matriz diagonal, cuyos elementos sobre la diagonal principal son los recipro- 
cos de los elementos que se encuen tr ar> en la diagonal principal de la matriz original. 
Por ejemplo. dado que 


"9 0 0“ 

A = 0 5 0 , 

.0 0 10_ 

‘1/9 0 0 

A -1 = 0 1/5 0 

0 0 1/10 
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CAPITULO CATORCE 


Analisis de regresion: 
el modelo lineal general 


14.1 Introduction 

En el capitulo 13 se examinaron los fundamentos del analisis de regresion para el 
modelo lineal simple. En este capitulo se extenderan los conceptos ya presentados 
al modelo lineal general para el cual una respuesta dada se considera como una fun- 
cion de varias variables de prediccion. Al examinar este modelo se estudiaran algu- 
nas formas para determinar el mejor conjunto de variables de prediccion por incluir 
en la ecuacion de regresion. Tambien se proporcionara un estudio detallado del an&- 
lisis de residuos (tambien conocidos como residuales), minimos cuadrados con fac- 
tores de peso (ponderados) y variables indicadoras, asi como ejemplos resueltos con 
gran detalle. Para este capitulo se emplearan los paquetes estadisticos para computa- 
doras Minitab y SAS (vease [6]). Se supone que este tipo de paquetes o algunos simi- 
lares se encuentran disponibles para el lector. Para un estudio mas teorico de los te- 
mas presentados en este capitulo, se invita al lector a que consulte [4]. 


14.2 El modelo lineal general 

Sean A ,, x 2 , ..., x k k variables de prediccion, las cuales pueden tener alguna influen- 
cia sobre una respuesta Y , y supongase que el modelo tiene la forma donde Y, es la 

Y ", = P 0 + PtXi, + P 2 x ,2 + ••• + Pk*ik + Si, i = 1, 2, ..., n, (14.1) 

i-esima observacion de la respuesta para un conjunto de valores fijos x n , x i2 , • • •. x ik 
de las variables de prediccion, e,- es el error aleatorio no observable asociado con Y,, 
y /3 0 , /3|, .... fi k son m = k + 1 parametros lineales desconocidos. La ecuacion 
(14. l) recibe el nombre de modelo lineal general y da origen a lo que se conoce como 
una regresion lineal multiple. 
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Si se supone el caso de la teoria basada en el modelo normal, las observaciones Y, 
son variables aleatorias independientes, normalmente distribuidas con 


E(Yj) - p 0 + p t x n + + p k x ik , 

Var(r,) = o- 2 , 1=1,2, 

De esta forma, los errores aleatorios e, son N (0, a 1 ) independientes. El modelo li¬ 
neal general define una ecuacion de regresion la cual representa un hiperplano, para 
la que el parametro /3 0 es el valor de la respuesta media cuando todas las variables de 
prediccion tienen un valor igual a cero. El parametro /3 ),j =1,2, k, represen¬ 
ta el cambio en la respuesta promedio para un cambio igual a una unidad de la 
correspondiente variable de prediccion Xj, cuando todas las demas variables de pre¬ 
diccion se mantienen constantes. En este sentido, fi, representa el efecto parcial de 
Xj sobre la respuesta. 

La unica restriction funcional que se impone al modelo lineal general es que sea 
lineal en los parametros desconocidos; el modelo no tiene ninguna restriction con 
respecto a la naturaleza de las variables de prediccion; por lo tanto surgen muchos 
casos especiales e interesantes, algunos de los cuales cabe mencionar. El modelo 

dado por (14.1) implica que los efectos que las variables de predicion x u x 2 . x k 

tienen sobre la respuesta son aditivos, de tal manera que la ecuacion de regresion 
propuesta es una funcion lineal de las variables de prediccion. Una ecuacion de este 
tipo se denomina modelo de primer orden. Sin embargo, es posible que dos o mas 
variables de prediccion interactuen, es decir, el efecto de una de las variables de pre¬ 
diccion sobre la variable de respuesta depende del valor de otra variable de predic¬ 
cion. Cuando esto ocurre, los efectos no son aditivos debido a la presencia en el mo¬ 
delo de un termino que contiene un producto cruzado el cual representa el efecto de 
interaccion. Por ejemplo, considerese un modelo que contiene dos variables de pre¬ 
diccion que interactuan. El modelo es 

Yi = Po + P\Xn + p 2 x i2 + fcx n x i2 + e,, (14.2) 

donde el sumando (3 2 x it x i2 refleja la interaccion entre .r, y x 2 . Si se define 

-*,3 = X n x i2 , i = 1,2. n, 

entonces (14.2) puede escribirse en la forma del modelo lineal general (14.1), y de 
esta manera se advierte que es un caso especial de este. Notese que para este caso es¬ 
pecial el significado de j3, y no es el mismo dado con anterioridad. La derivada 
parcial de la respuesta media con respecto a .r, (o con respecto a x 2 ) representa el 
efecto sobre la respuesta media por unidad de cambio en .v, (,v 2 ) cuando .v 2 (.v,) se 
mantiene fija. Las derivadas parciales son 


*W) 

d.v, 


= P\ + P}*7 


i>E{Y) 

dx z 


~ @2 + Pi x \ ■ 
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Otro caso interesante surge cuando en (14.1) se tiene 

x u = xj, / = 1, 2, n, j = 1, 2, k. 

Entonces el modelo lineal general toma la forma 

y, = /3o /31 Xj + Pi*] + ”■ -+ Pk x> i + (14.3) 

la cual se conoce como modelo curvilineal o polinomial. En este caso se supone que la 
respuesta promedio es una funcion polinbmica de grado k de una sola variable de 
prediccibn. Por lo tanto, la ecuacion de regresibn propuesta para la respuesta pro¬ 
medio es una funcibn no lineal de la variable de prediccibn, pero sigue siendo lineal 
en los parametros. Es importante notar que lo que se busca en este caso es el grado k 
que mejor se ajusta a una muestra aleatoria de la variable respuesta. 

Para describir en forma adecuada una variable respuesta dada, muchas veces es 
necesario incluir terminos lineales, cuadraticos y de interaction en el modelo pro- 
puesto. Por ejemplo, un modelo para dos variables de prediccibn podria ser 

Y t = p 0 + f}\X n + f3 2 x, 2 + p 3 x}, + 0 4 xj 2 + /3 5 x„x (2 + Bj. (14.4) 

A1 definir nuevas variables de prediccibn, asi como se hizo anteriormente para los 
terminos cuadraticos y de interaccion, se observa que (14.4) tambien es un caso espe¬ 
cial del modelo general. Este tipo de modelo se denomina ecuacion completa de 
segundo orden y define varias superficies para la respuesta promedio como una fun¬ 
cion no lineal de las variables de prediccibn x, y x 2 . Para k 2 variables de pre¬ 
diccion distintas, una ecuacibn de regresibn completa de segundo orden consiste en 
un termino constante, k terminos lineales, k terminos cuadraticos y k(k - l)/2 ter¬ 
minos de interaccibn. 

A continuacibn se regresara al modelo lineal general dado en (14.1) para obtener 
los estimadores de minimos cuadrados de los parametros y para desarrollar tecnicas 
de regresibn para este modelo. Todos los casos especiales mencionados con anterio- 
ridad asi como muchos otros que no se citaron de manera especifica, se encuentran 
incluidos en el siguiente analisis. Se empleara el algebra de matrices, ya que esta sim- 
plifica en gran medida la presentacibn. 

Dada una muestra aleatoria de observaciones V, , Y 2 , ..., Y„ en los puntos de 

observacion x M , x, x 12 , ..., x u , x 2) , x, 2 , .... x 2k .x nl , x„, . x nk , respectiva- 

mente, con base en el modelo lineal general, se tienen las n ecuaciones siguientes: 

Y, = /3 0 + /8,-r, | + /3 z x l2 + ■■■ + (3 k x u + e, 

Y Z — + /31 -X 2 1 + P 2 X 22 ■” + Pk x 2k + e 2 

Y„ = J3„ + 0 |X„| + 0 2 x n2 + ••• + Pk x nli + C„. 

Como resultado, el modelo lineal general tambien puede expresarse en forma ma- 
tricial como 

Y = X/3 + <r, ( |4 - 5) 

www. FreeLibros. com 



506 Analisis de regresion: el modelo lineal general 


donde 



~rr 


'1 

*11 

*12 • 

•' *u~ 


0o" 


£| 

Y = 

Y 2 

, X = 

1 

*21 

*22 

" *2 k 

. 0 = 

(3. 

, « = 

£2 


_Yn. 


1 

*„l 

*«2 .’ 

•• *„*_ 






El lector no tendra ninguna dificultad para reconocer que (14.5) tiene la misma for¬ 
ma matricial que el modelo lineal simple (13.37), excepto que ahora X es una matriz 
den x m para las variables de prediccibn, y /3 es un vector de parametros descono- 
cidos de m x 1, mientrasque Yy e siguen siendo vectoresden x 1, losquecontie- 
nen las observaciones de la variable de respuesta y los errores aleatorios asociados 
con estas, respectivamente. 

Bajo el caso de la teoria normal 

Y ~ MX/3, o- 2 I), 
e ~ N(0, a 2 l), 

donde 


Var( Y) = Var(e ) = cr 2 I. 

De esta manera Y y e son vectores de variables aleatorias independientes normal- 
mente distribuidas. 

Para la estimation de los parametros por minimos cuadrados las ecuaciones nor- 
males toman la misma forma dada por (13.40), o 

(X'X)B - X'Y 

donde, ahora, (X'X) es un matriz de m x n y B es un vector de m x 1 el cual conve¬ 
ne los estimadores de minimos cuadrados B 0 , B,, ..., B k . Si (X'X) tiene inversa, la 
solution para el vector B esta dada por 

B = (X'X) 'X'Y. 

Por lo tanto, la ecuacion estimada de regresion es 

Y = XB, (14.6) 

donde el vector Y de n x 1 contiene los valores estimados para la respuesta prome- 
dio correspondientes a los n puntos de observation de las variables de prediction. La 
diferencia entre los vectores Y y Y proporciona el vector de residuos. 

Puede demostrarse que las propiedades de los estimadores de minimos cuadra¬ 
dos B 0 , B . B k son extensiones de las propiedades de los estimadores para el 

modelo lineal simple, es decir, de acuerdo con el caso de la teoria normal, los estima¬ 
dores tambien son de maxima verosimilitud, de tal manera que lo siguiente se verifica: 
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1. Cada Bj tiene una distribuci6n normal con media E(Bj) = Pj,j = 0, 1, 2, , *, 

y varianza Var(Bj) = c u + „ cr 2 , j = 0, 1,2, ..., *, donde c u + () es el 
elemento de la diagonal O' + 1) de (X'X) -1 . : • > 1 

2. Cov(Bi , fi ; ) = c ( , + i )>0 + 1) o- 2 , / ^ j = 0, 1, 2, ...,*, donde c„ +y+ 'ij' es 
el elemento de (X'X) -1 que se encuentra en el rengldn (/ + 1) y la columna O’ + 1) 
para i ^ j. 

Un estimador no sesgado de la varianza del error es 


n2 Y'Y - B'X'Y 
^ — , 
n — m 


(14.7) 


donde el numerador de (14.7) no es mas que la suma de los cuadrados de los resi- 
duos. N6tcse que el denominador de (14.7) es igual al numero de observaciones, 
menos el numero de par&metros que figuran en el mode!' 1 , e’ que para el modelo li¬ 
neal general es m = k + 1. Por lo tanto, una estimacibn de Var(Bj) es 

s\Bj) = c (y+l) s 2 , j = 0, 1, 2, ..., k, 

donde c u+ ,) tiene un valor igual al ya definido con anterioridad. 

De los resultados anteriores puede deducirse que la cantidad 

(Bj - (ij)/s{Bj), y = 0,1,2,...,*, 

es una variable aleatoria i de Student con n -m grados de libertad. Entonces, un in- 
tervalo de confianza del 100(1 - a)% para el parametro es 

bj ± /|-„/2. j = 0, 1,2, ...,*, (14.8) 

y una estadistica apropiada para probar la hipotesis nula 

H 0 : Pj - 0 

contra cualquier alternativa, ya sea esta uni o bilateral, es la ya familiar t de Student 
T = Bj/siBj), j = 0 , 1 , 2 ,...,*, 
con n - m grados de libertad. 

Considerese la tecnica del analisis de varianza para probar la hipotesis nula 

— Pi — - Pk = 0 

contra la alternativa 

H,: Bj 0 para algun j = 1,2,...,*. 

Dado que H 0 establece que todos los parametros de regresion son iguales a cero, ex- 
cepto el termino constante, esto implica que no existe ninguna relacion igual a la es- 
pecificada por el modelo propuesto entre la respuesta y el con junto de variables de 
prediccion. No obstante, se advierte al lector que el hecho de rechazar a H 0 no nece- 
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sariamente implica que la ecuaci6n estimada de regresibn sea util para efectuar pre- 
dicciones. Se necesita profundizar el an&lisis antes de que se pueda dar un juicio de¬ 
finitive sobre la utilidad de la ecuacibn de regresion. 

A1 seguir el mismo argumento para el modelo lineal general que el dado para el 
modelo lineal simple en la seccibn 13.7, puede demostrarse que la suma total de cua- 
drados se encuentra dividida en la suma de cuadrados de la regresibn y en la 
suma de cuadrados de los errores. Mediante el empleo de la notacibn matricial, 
STC, SCR y SCE se encuentran definidos en la tabla 14.1. 

El numero total de grados de libertad sigue siendo n - 1, pero el numero de gra- 
dos de libertad para el error ahora es de n -m. Los grados de libertad para la regre¬ 
sion son (n - 1) - (n - m) = m - 1 = k, dado que m = k + 1. La varianza residual o 
SCE/(n -m) es el cuadrado medio del error y SCR/(m - 1) es el cuadrado medio de 
la regresion. Bajo la hipotesis nula, la estadistica de prueba apropiada es 

F = CMR/CME, 

la cual tiene una distribucion F con m -1 y n - m grados de libertad. A1 igual que en 
los casos anteriores, puede argumentarse que si un valor de esta estadistica es lo sufi- 
cientemente grande, entonces una porcion considerable de la variacion en las obser- 
vaciones puede atribuirse a la regresion de Y sobre las variables de prediccibn como 
se encuentran definidas por el modelo. De esta forma se rechaza la hipotesis nula 
siempre que el valor calculado se encuentre en el interior de una region critica de ta- 
mafio & en el extremo superior de la distribucion. En la tabla 14.1 se da la tabla de 
analisis de varianza para el modelo lineal general. 

Para el modelo lineal general la nocion del coeficiente de determinacion se ex- 
tiende para dar origen a lo que se conoce como coeficiente de correlacidn multiple o 
coeficiente de determinacidn multiple. El coeficiente de correlacion multiple se defi¬ 
ne como 


SCR SCE 

STC ” STC’ 


(14.9) 


y al igual que r 2 , mide la proporcion de la variacion total de las observaciones con 
respecto a su media, atribuible a la ecuacibn de regresion estimada. En otras pala- 


TABLA 14.1 Tabla ANOVA para el modelo lineal general 


Fuenle de 
variacion 

Numero de 
grados de libertad 

Sumas de 
los cuadrados 

Cuadrados medios 

Estadistica F 

Regresion 

Error 

k - m ~ 1 

n - m 

ilYf 

BXY - 1 - — 

n 

Y'Y - B'X'Y 

SCR l(m - 1) 

SCE/l/i - m) 

SCR/(m - 1) 
SCE/(n - m) 

Total 

n - 1 

Y Y - 

n 
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bras, R 2 es una medida relativa de que tanto las variables de prediction incluidas en 
el modelo explican la variation de las observaciones. A1 igual que para el modelo li¬ 
neal simple, 0 R 2 1, y entre m&s cercano a uno es el valor de R 2 mayor es la 
cantidad de la variation total que puede explicarse por medio de los terminos que 
aparecen en el modelo. Por si mismo, R 2 no puede validar el modelo propuesto, ni 
tener un valor de R 2 cercano a uno necesariamente implica que la ecuaciOn de regre- 
siOn estimada sea apropiada para predicciOn. 

SupOngase que se desea predecir la respuesta promedio cuando las k variables de 
predicciOn toman los valores especificos x,, x 2 , ..., x k , respectivamente. En nota- 
cion matricial, sea 


X; = [lx, x 2 — xj 

un vector renglOn el cual identifica las coordenadas para las cuales se va a formular 
la predicciOn. Entonces la respuesta promedio estimada es 

y p = x;b 

= Bq + 5,x, + B 2 x 2 + ■" + B k x k . (14.10) 

Dada (14.10), puede demostrarse que 

Var(Y„) = cr 2 X;(X'Xr'X p . 

De esta forma, una estimaciOn de Var( Y p ) es 

= s 2 x;(x'xr'x p , (i4.ii) 

donde s 2 es la varianza residual y X es la matriz original de valores x, los cuales dieron 
origen a la ecuacion de regresiOn estimada. De acuerdo con el caso de la teoria nor¬ 
mal, un intervalo de confianza del 100(1 - a)% para la respuesta promedio en 
x,, x 2 , .... x*,es 

y„ ± r,_„ /2 . „- m s{Y p ). (14.12) 

Si se desea estimar una respuesta particular para x,, x 2 . x k , la predicciOn es- 

tara dada por (14.10), pero la varianza sera 

VariY^) = cr 2 [ 1 + X;(X' X)“ 1 X,,]. 

Por lo tanto, un intervalo de predicciOn del 100(1 - a)% para el valor real de la 
respuesta en x,, x 2 . x k , es 

S' pan ± h- a ,2.n- m S(Y pHn ), 04.13) 

donde 


S 2 (Kn) = S 2 [ 1 + X;(X'X)-%]. 
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Ejemplo 14.1 N.H.* Prater desarroll6 una ecuaciori.de regresidn para estimar la 
produccion de gasolina como una funci6n de las propiedades de destilacion de cierto 
tipo de petr61eo crudo. Se identificaron cuatro variables de prediccion: la gravedad 
del petrdleo crudo, “API (x,); la presidn de vapbr .deLpetrdleo crudo, psi(x 2 ); el 
punto de 10% ASTM para el petrdleo crudo, °F (x 3 ) y el punto final ASTM para 
la gasolina, °F (x 4 ). Los primeros dos miden la gravedad y la presi6n. de vapor del 
petroleo crudo. El punto de 10% ASTM es la temperatura para la cual se ha evapo- 
rado cierta cantidad de liquido, y el punto final para la gasolina es la temperatura 
para la cual se ha evaporado todo el liquido. La variable respuesta fue la cantidad de 
gasolina producida expresada como un porcentaje respecto al total de petr61eo cru¬ 
do. El objetivo radic6 en determinar una ecuaci6n de regresi6n para la producci6n 
de gasolina como una fundon lineal de las propiedades de destilacion de cierto tipo de 
petroleo crudo x,, x 2 , x 3 y el punto final deseado para la gasolina x 4 . Los datos de la¬ 
boratory obtenidos por Prater se muestran en la tabla 14.2. 

Se empleann los datos que aparecen en la tabla 14.2 para ilustrar las tecnicas que 
hasta este momento se han presentado para regresidn lineal multiple mediante el 
empleo del paquete SAS. Este problema tambien se considerara como perteneciente 
a un problema particular que puede encontrarse en la regresidn lineal multiple y que 
se conoce como multicolinealidad. Debe notarse que desde la publicacidn de los 
datos de Prater, en 1956, varios autores los han empleado con el proposito de 
ilustrar diferentes aspectos del modelo lineal general. Entre ellos, Daniel y Wood [2] 
desarrollaron una ecuacidn de regresidn muy diferente a la dada por Prater. 

Mediante el empleo de una opcion de S/4S, denominada GLM, se ajusta el mode¬ 
lo lineal 


Y = /3 0 + jS|X, + (3 2 x 2 + /2 3 x 3 + /3 4 x 4 + e. 

En la figura 14.1 se proporciona el listado de computadora. Ndtese que en la parte 
inferior de este se encuentran cinco columnas de informacidn. La primera columna 
de la izquierda identifica a las variables de prediccion en el modelo que incluyen al 
termino constante. La segunda columna proporciona las estimaciones por minimos 
cuadrados; en la tercera se encuentran los valores t de Student para probar la hipote- 
sis nula de que el valor del parametro es cero; la cuarta columna da la probabilidad 
(valor p) de observar un valor t de Student, al menos tan grande en magnitud, como el 
valor observado (ignorando su signo) y la quinta columna proporciona las desviacio- 
nes estandar (errores) para las estimaciones por minimos cuadrados. De esta forma, 
la ecuacidn estimada de regresidn (tomando en cuenta solo dos cifras decimales) es 

y - -6.82 + 0.23x, + 0.55x 2 - 0.15x 3 + 0.15x 4 . 

En la parte superior de la figura se encuentra la tabla ANOVA con gl(CMR)= 4, 
SCR = 3 429.27, CMR = 857.32, gl(SCE) = 27, SCE = 134.80, ECM = 4.99, 


* N.H. Prater, Estimate gasoline yields from crudes. Petroleum Refiner 35 (1956), 236-238. La reproduc- 
ci6n de la tabla se hizo con el permiso de Petroleum Refiner (posteriormente Hydrocarbon Processing), 
Mayo 1956. 
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TABLA 14.2 Datos de la muestra para el ejemplo 14.1 


Observacidn 

Y 




, . •• VxfZ 

1 

6.9 

38.4 

6.1 

220 

235 

2 

14.4 

40.3 

4.8 

231 

307 

3 ' 

7.4 

40.0 x 

6.1 

217 

212 

4 

. 8.5 

- 31.8 \ 

0.2 

316 

365 

5 

8.0 

40.8 

3.5 

210 

218 

6 

2.8 

41.3 

1.8 

267 

235 

7 

5.0 

38.1 

1.2 

274 

285 

8 

12.2 

50.8 

8.6 

190 

205 

9 

10.0 

32.2 

5.2 

236 

267 

10 

15.2 

38.4 

6.1 

220 

300 

11 

26.8 

40.3 

4.8 

231 

367 

12 

14.0 

32.2 

2.4 

284 

351 

13 

14.7 

31.8 

0.2 

316 

379 

14 

6.4 

41.3 

1.8 

267 

275 

15 

17.6 

38.1 

1.2 

274 

365 

16 

22.3 

50.8 

8.6 

190 

275 

17 

24.8 

32.2 

5.2 

236 

360 

18 

26.0 

38.4 

6.1 

220 

365 

19 

34.9 

40.3 

4.8 

231 

395 

20 

18.2 

40.0 

6.1 

217 

272 

21 

23.2 

32.2 

2.4 

284 

424 

22 

18.0 

31.8 

0.2 

316 

428 

23 

13.1 

40.8 

3.5 

210 

273 

24 

16.1 

41.3 

1.8 

267 

358 

25 

32.1 

38.1 

1.2 

274 

444 

26 

34.7 

50.8 

8.6 

190 

345 

27 

31.7 

32.2 

5.2 

236 

402 

28 

33.6 

38.4 

6.1 

220 

410 

29 

30.4 

40.0 

6.1 

217 

340 

30 

26.6 

40.8 

3.5 

210 

347 

31 

27.8 

41.3 

1.8 

267 

416 

32 

45.7 

50.8 

8.6 

190 

407 


gl ( STC) = 31 y STC = 3 564.08. El valor Fcalculado para probar la hipotesis nula 

: / 31 = / 3 2 = / 3 3 = = 0 

es de 171.71, y la probabilidad de observar un valor mayor se encuentra inmediata- 
mente a la derecha de este. Debajo del valor p esta la desviacion estandar residual, s 
= 2.23. El coeficiente de correlation multiple es 0.9622, lo cual significa que alrede- 
dor de un 96% de la variacion total de las observaciones con respecto a su media 
puede explicarse por las cuatro variables de prediction incluidos en la ecuacion de 
regresion. 

En el extremo superior derecho, esta el coeficiente de variacion, el cual se definio 
en el capitulo 3. En este caso, el valor de CV es el cociente de la desviacion estandar 
residual entre la media de las observaciones. Ya que en este caso s = 2.23 y y = 
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19.66, CV = 11.37%. Enelan&lisis de regresibn es deseable queladesviacibn est&n* 
dar residual sea una pequefla fraccibn de la media de las observaciones, ya que lo an¬ 
terior, en general, implica que gran parte de la variacibn en la respuesta se explica 
mediante las variables de prediccibn en la ecuacibn de regresibn. En la siguiente sec- 
cibn'se dar&n m&s explicaciones con respecto a la informacibn que se encuentra en la 
parte media de la figura. . ■C 

Con base en el analisis anterior, existe una pequefla duda de que la regresibn 
entre la produccibn de gasolina y las cuatro variables de prediccibn sea estadistica- 
mente significativa. Debido a que se rechaza la hipbtesis nula de que todos los coefi- 
cientes de regresibn (excepto el termino constante) son iguales a cero y el 
valor del coeficiente de correlacibn multiple es relativamente alto al 0.9622. Sin em¬ 
bargo, existe una razbn para preocuparse con respecto a la utilidad de la ecuacibn de 
regresibn dada. Por ejemplo, las desviaciones estandar de los estimadores de mini- 
mos cuadrados para /3 0 y /3 2 son grandes, lo que sugiere que x v y posiblemente otras 
variables de prediccibn, puedan no tener un gran efecto sobre la produccibn de gaso¬ 
lina. En las siguientes secciones se examinaran los procedimientos adecuados para 
obtener la mejor ecuacibn de regresibn para un conjunto dado de variables de pre¬ 
diccibn. Los datos del ejemplo 14.1 se utilizaran de vez en cuando para otros ejemplos 
en este capitulo. 


14.3 Principio de la suma de cuadrados extra 

La inclusibn de una variable de prediccibn en un modelo de regresibn no implica, en 
forma necesaria, que tenga un efecto substancial sobre la respuesta dada; es decir, 
cuando un investigador identifica un conjunto de variables de prediccibn, esto indi- 
ca el potencial de las variables para explicar la variacibn en la respuesta. Queda por 
comprobarse si algunas realmente lo hacen. 

El procedimiento apropiado para encontrar los efectos individuales de las varia¬ 
bles de prediccibn se basa en el principio de la suma de cuadrados extra. Este princi¬ 
pio permite determinar la reduccion en la suma de los cuadrados de los errores cuan¬ 
do se introduce un coeficiente adicional de regresibn para alguna funcibn de una 
variable de prediccibn en la ecuacibn de regresibn. Cabe recordar dos cosas impor- 
tantes: 1) la suma total de cuadrados sigue siendo la misma sin importar el numero 
de terminos que se introduzcan en el modelo de regresibn. 2) La suma de los cuadra¬ 
dos de los errores siempre disminuye (cuando menos un poco) conforme se afladen 
mas terminos al modelo. 

Dado que la suma de los cuadrados de regresibn es la diferencia entre STC y SCE, el 
incremento en SCR tiene un limite conforme se suman mas terminos al modelo. Una 
estrategia logica en la regresibn lineal multiple es la de afladir no cualesquiera termi¬ 
nos, al modelo, sino solo aquellos que incrementen en forma significativa la suma de 
los cuadrados de regresibn y de esta manera disminuyan significativamente la suma 
de los cuadrados de los errores. Como ejemplo, en el modelo lineal simple, SCR es la 
suma extra de los cuadrados debida a la inclusibn del termino lineal fj,x en el mode¬ 
lo. En otras palabras, SCR representa la reduccion en la suma de los cuadrados de 
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los errores cuando se aflade un efecto lineal de la variable de prediction al modelo 
original. 

Yi = Po + Ei- 

Para ilustrar el principio de la suma de cuadrados extra, se emplear&n, de los 
datos de Prater como variables de prediccion potenciales, solo a x 2 y y se ajusta- 
ran todas las posibles regresiones de la production de gasolina para esas dos va¬ 
riables. Existen tres ecuaciones de regresion; dos que toman en cuenta a x 2 y x 3 en 
forma individual y la tercera que contiene a ambas variables x 2 y x y En la tabla 14.3 
se proporcionan las ecuaciones de regresidn estimadas y sus correspondientes tablas 
de an&lisis de varianza. Ndtese que se ha empleado la notation SCR(x), SCR(x v x) y 
SCE(x 2 , x 2 ), para denotar que estas sumas de cuadrados son funciones de las varia¬ 
bles de prediccion ya indicadas en la ecuacion de regresidn y de los correspondientes 
coeficientes de minimos cuadrados. 

A continuacion se examinaran los resultados que se encuentran en la tabla 14.3. 
Como ya se ha mencionado, para las 32 observaciones dadas de la respuesta, la 


TABLA 14.3 Ecuaciones estimadas de regresion y tablas ANOVA para la produccion de ga¬ 
solina, tomando en cuenta a x 2 y/o x i 




a) y = 13.09 

+ I.57jc 2 


Fuente de 
variacidn 

gl 

SC 

CM 

Valor F 

Regresidn 

1 

SCR(jc 2 ) = 525.74 

CMRU 2 ) = 525.74 

5.19 

Error 

30 

SCE(* 2 ) = 3038.34 

CME(x 2 ) = 101.28 


Total 

31 

STC = 3564.08 

/o. 95 . 1.30 = 4.17 




b) y = 41.39 

- O.Q9x } 


Fuente de 

variaciort 

gl 

SC 

CM 

Valor F 

Regresidn 

1 

SCR(jcj) = 353.70 

CMR(.tj) - 353.70 

3.31 

Error 

30 

SCE U,) = 3210.38 

CME(xj) = 107.01 


Total 

31 

STC = 3564.08 

ft ‘is. i. 30 = 4.17 




c) v = -2.52 + 2. 

.26.x, + 0.05.x, 


Fuente de 

variacidn 

gl 

SC 

CM 

Valor F 

Regresidn 

2 

SCR(x 2 .x,)'= 547.49 

CMRU 2 ,.Vj) - 273.74 

2.63 

Error 

29 

SCEU:. .v,) = 3016.59 

CMEU : ,.v,) = 104.02 


Total 

31 

STC = 3564.08 

f)MS. 2 . 29 = 3.33 
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suma total de cuadrados es STC = 3 564.08 sin importar cuantas variables de predic¬ 
tion se incluyan en el modelo. Para la regresion de Y sobre x 2 ,SCR(x 2 ) = 525.74es la 
reduction en la suma de los cuadrados de los errores cuando se aiiade el termino f3 2 x 2 
al modelo K, = /3 0 + e, . En otras palabras, si se ajusta el modelo Y t = /3 0 + e, , se 
supone que la unica fuente de variation en Y, es el error aleatorio; la recta de regre¬ 
sion estimada es simplemente K, = Y. Cuando se agrega el termino f3 2 x 2 al mode¬ 
lo, entonces parte de la variacibn total puede explicarse por la presencia de x 2 . 
Esto es lo que precisamente representa SCR(x 2 ) = 525.74, SCR(x 2 ) es la suma extra * 
de cuadrados en la que disminuye SCE cuando se aiiade el termino /3 2 x 2 al modelo. 
Al emplear el mismo argumento para la regresion de Y sobre x 3 , SCR (x 3 ) = 353.70 
es la suma extra de cuadrados en los que disminuye el error cuando se aiiade el termi¬ 
no j8 3 x 3 al modelo Y, = /3 0 + e,. Para cualquier otro caso, si la reduccion en la 
suma de los cuadrados de los errores es substancial, se rechaza la hipotesis nula de 
valor cero para el correspondiente coeficiente de regresion. Notese que se rechaza 
x 2 , //o' fi 2 — 0 para laregresi6n de Y sobre x 2 (^"3\.o r f — 5.19 > /o. 95.1.30 = 4.17), 
pero para la regresibn de Y sobre jc 3 , // 0 : )S 3 = 0 no puede rechazarse. 

Considerese la regresion de Y sobre x 2 y x } . Lo que se desea determinar es la re¬ 
duccion en la suma de los cuadrados de los errores cuando se aiiade el termino /3 3 x 3 
al modelo, el cual ya contiene el termino constante /3 0 y el termino (3 2 x 2 , o la reduc¬ 
cion en SCE cuando se introduce el termino fi 2 x 2 al modelo, el cual ya contiene a /3 0 
y /3 3 x 3 . Notese que para el modelo c de la tabla 14.3 la suma de los cuadrados de los 
errores cuando se incluye en el modelo de regresibn, tanto a x 2 como a x 3 es SCE(x v 
x 3 ) = 3 016.59. Pero cuando solo se tiene a x 2 en el modelo, SCE(x 2 ) = 3 038.34. 
Por lo tanto, la diferencia entre SCE(x 2 )y SCE(x v x 3 ) debe ser la suma de cuadrados 
extra debida a la inclusion del termino /3 3 jc 3 en el modelo que ya contiene a los ter- 
minos /3 0 y /3 2 x 2 . Se denotara esta diferencia por SCR(x 3 | x 2 ). De esta forma 

SCR(x 3 I x 2 ) = SCE(x 2 ) - SCE(* 2 , x } ) (14.14) 

= 3038.34 - 3016.59 
= 21.75 

es la reduccion adicional en la suma de los cuadrados de los errores cuando se intro¬ 
duce x 3 en el modelo que ya contiene a x 2 . 

Dado que una reduccion en la suma de los cuadrados de los errores significa un 
aumento correspondiente a la suma de los cuadrados de la regresion, 

SCR(.r 2 , x } ) — SCR(x 3 | jc 2 ) + SCR(x 2 ) (^4.15) 

= 21.75 + 525.74 
= 547.49. 

La suma de los cuadrados de la regresion, cuando figuranen el modelo, tanto x 2 como 
x v se separa en dos componentes, cada uno de estos con un grado de libertad. SCR 

(x 3 | a: 2 ), el cual refleja la contribucion deXj cuando esta se anade al modelo Y = A) 

+ fj 2 x 2 + e, y SCR(x 2 ) la cual mide la contribucion dex 2 cuando esta se aiiade al 
modelo Y = (3 0 + e. 
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TABLA 14.4 Tabla ANOVA aumentada para la regresibn de Y sobre x 2 y x, 


Fuente de 
variacidn 

gl 

sc 

CM 

Valor F 

Regresibn 

2 

SCR (x 2 , x 3 ) = 547.49 

CMR(x 2 , x 3 ) = 273.74 

2.63 

*2 

1 

SCR (x 2 ) = 525.74 

CMR(x 2 ) = 525.74 

' 5.05 

X 3 I x 2 

1 

SCR(x, | x 2 ) = 21.75 

CMR fxj | x 2 ) = 21.75 

0.2 

Error 

29 

SCE(x 2 , x 3 ) = 3016.59 

CME(x 2 , x 3 ) = 104.02 


Total 

31 

STC = 3564.08 

fo.95, 2 , 29 ~ 3.33; To, 95 , 

1 . 29 = 4.18 


Se puede demostrar que SCR(x 2 | x 2 ) y SCR(x 2 ) son variables aleatorias indepen- 
dientes chi-cuadrada, cada una con un grado de nberiad; entonces puede hacerse una 
comparacibn entre el cuudrado medio correspondiente a SCR( x 3 | jc 2 ), o el de 
SCR(x 2 ), y el cuadrado medio del error, CME{x 2 , x 3 )por medio de la estadistica F. 
Esta prueba se conoce como prueba Fparcial sobre una variable de prediction. En 
realidad, la prueba Fparcial determina si la contribution de un coeficiente de regre¬ 
sibn es lo suficientemente grande para garantizar su inclusion en el modelo, dado 
que otros terminos no toman en cuenta al coeficiente que ya se encuentra en el mis- 
mo. Por lo tanto, en cierto sentido, se intenta enjuiciar el efecto individual de la co¬ 
rrespondiente variable de prediccibn sobre una respuesta dada. La tabla ANOVA 
aumentada para la regresibn de Y sobre x 2 y x 3 , la cual incluye las pruebas F par- 
ciales, se muestra en la tabla 14.4. Nbtese que la inclusion del termino /3 2 x 2 en el 
modelo Y = /3 0 + e tiene un efecto benefico, mientras que la inclusion de /3 3 jc 3 en 
Y = fio + fiiX 2 + e no. 

A lo largo de toda la presentacion anterior se supuso que el termino /3 3 jc 3 era el 
ultimo en sumarse al modelo que incluye ax 2 y x 3 . Sin embargo, es posible realizar 
pruebas parciales F para cada coeficiente de regresibn, como si la correspondiente 
variable de prediccion fuese la ultima en haberse anadido al modelo. De esta forma, 
los efectos individuales de cada variable de prediccion, en presencia de las otras, 
pueden comprobarse. Para el ejemplo, lo que se desea es determinar la contribucion 
del termino fi 2 x 2 cuando el modelo ya contiene aft ya /3 3 x 3 . 

Al seguir el mismo procedimiento dado con anterioridad, la suma de los cuadra- 
dos de los errores cuando, tanto x 2 como ,r 3 se encuentran en el modelo, es SCE(x 2 , 
x 3 ) = 3 016.59. Pero cuando solo se encuentra ,r 3 en el modelo, SCE(x } ) = 3 210.38. 
De esta forma, la reduccion en el valor de la suma de los cuadrados de los errores 
cuando se anade el termino /3 2 x 2 al modelo que ya contiene a /3 0 y /£i 3 jc 3 es 


SCR(x 2 | ,r 3 ) = SCE(.v 3 ) - SCEUi, jc 3 ) (14.16) 

= 3210.38 - 3016.59 
= 193.79. 

Entonces la suma de los cuadrados de regresibn, cuando .v 2 y x } se encuentran en el 
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modelo, la suma de los dos componentes es 

SCR(x 2 , x 3 ) = SCR(-t 2 1 x y ) + SCR(x 3 ) (14.17) 

= 193.79 4- 353.70 
x = 547.49, 

cada componente con un grado de libertad. Una consecuencia importante de todo lo 
anterior, es que tanto SCR(x 2 \ Xy) = 193.79 y SCR(x 3 1 x 2 ) = 21.75 son mas pequefios 
que SCR(x 2 ) = 525.74 y SCR(x 3 ) = 353.70, respectivamente. El porque de lo ante¬ 
rior constituye el tema de la siguiente seccion. 

Para determinar las pruebas Fparciales para la regresion debida axy,oax 2 dada 
Xy, ahora es posible tener otra version de la tabla 14.4; esta se muestra en la tabla 
14.5. Notese que una comparacion entre los resultados de las tablas 14.4 y 14.5 
muestra un desacuerdo con respecto al efecto de x 2 sobre la production de gasolina. 
Mientras que la regresion lineal simple de Y sobre x 2 es estadisticamente significativa 
{f = 5.19), la regresion de Y sobre x 2 dada la presencia de x 3 , no lo es (f = 1.86). Se 
dara mas information con respecto a esm ocurrencia en la siguiente seccion. 

El principio de la suma de cuadrados extra se extiende de manera directa para 
aplicar la idea basica a cualquier numero de variables de prediccion. Por ejemplo, 
supongase que se tienen tres variables de prediccion x p x 2 y x y Se puede definir la re¬ 
duction en la suma de los cuadrados de los errores, cuando una de estas se aflade al 
modelo que ya contiene a las otras dos, de la siguiente manera: 

SCR(x 3 1 x,, x 2 ) = SCE(x,, x 2 ) - SCE(.t,, jc 2 , x 3 ), (14.18) 

SCR(x 2 | x, , x 3 ) = SCE(x,, x 3 ) - SCE(x,, x 2 , x 3 ), (14.19) 

SCR(x, | x 2 , x 3 ) =SCE(x 2 ,x 3 ) - SCE(X|, x 2 , x 3 ). (14.20) 

Para desarrollar expresiones similares a (14.15) o (14.17), de (14.14) se deduce que 

SCR(x 2 |x|) =SCE(X|) - SCE(x,,x 2 ), 


TABLA 14.5 Tabla ANOVA aumentada para la regresion de Y sobre x 2 y x } 


Fuente de 
variation 

gl 

SC 

CM 

Valor F 

Regresion 

2 

SCR(.r,, .v,) = 547.49 

CMR(.t,. .v,) - 273.74 

2.63 

x 3 

1 

SCR(x 3 ) = 353.70 

CMR(x 3 ) = 353.70 

3.40 

x 2 | x 3 

1 

SCR(.t 2 | x 3 ) = 193.79 

CMRlx, | x 3 ) = 193.79 

1.86 

Error 

29 

SCE(.r,, x 3 ) = 3016.59 

CME(x,.x 3 ) = 104.02 


Total 

31 

STC = 3564.08 

f<Q 95 . 29 “ 3-33; 7 ( 195 . 1 

.» = 4.18 
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o 

SCE(jT|,x 2 ) = SCE(.*|) - SCR(j: 2 | *,). (14.21) 

Ahora, cuando s61o se tiene a x x en el modelo, por definici6n 

SCE(jc,) = STC - SCR (jc,); 

pero cuando todas las tres variables se encuentran en el modelo, 

STC = SCR(jc,, x 2 , x 2 ) + SCEUi, x 2 ,x 2 ). 


Entonces 

SCE(jc,) = SCR(jc,, x 2 , jc 3 ) + SCE(.r,, x 2 , x 2 ) - SCR(j,), 

y al sustituir SCE(x) en (14.21), se obtiene 

SCE(^,, x 2 ) = SCR(*,, x 2 , * 3 ) + SCE^,, x 2 , x 2 ) 

- SCR(jc,) - SCR(jc 2 I x,). (14.22) 

Al sustituir (14.22) por SCE(x y , x 2 ) en (14.18) se obtiene el resultado deseado 

SCR(jc 3 | jc,, jc 2 ) = SCR(jt|, x 2 , jc 3 ) - SCRCr,) - SCR(jc 2 | jc,), (14.23) 

o 

SCR(jc,, x 2 , x } ) = SCR(jc,) + SCR(jc 2 1 jc,) + SCR(jc 3 1 jc,, jc 2 ). (14.24) 

La suma de los cuadrados de regresion, cuando las tres variables se encuentran 
en el modelo, tiene tres componentes, cada uno con un grado de libertad. SCR(x t ) 
mide la contribucion (reduction en la suma de los cuadrados de los errores) de jc, 
cuando se aftade jc, al modelo Y = /3 0 + e; SCR(x 2 j jc,) representa la contribu¬ 
cion de jc 2 cuando esta se introduce al modelo Y = f3 0 + 0i*i + e; y SCR(jc 3 | jc,, x 2 ) 
es la contribucion de jc 3 cuando esta se agrega al modelo Y = \ 3 0 + Pi*i + 02*2 + e. 

Al emplear (14.19) o (14.20) y si se sigue el mismo procedimiento, pueden esta- 
blecerse resultados similares a (14.24) de la siguiente manera: 

SCR(jc,, jc 2 , jc 3 ) = SCR(jc,) + SCR(jc 3 | jc,) 4- SCR(.c 2 1 jc,, jc 3 ), (14.25) 

SCR(.c,, jc 2 , j: 3 ) = SCR(c 2 ) +SCR(x 3 |.r 2 ) + SCR(.c, | jc 2 , jc 3 ). (14.26) 

Estos resultados permiten que se lleven a cabo pruebas F parciales sobre cada 
coeficiente de regresidn como si la variable de prediction asociada con este hubiese 
sido la ultima en incluirse en el modelo. En otras palabras, con las pruebas parciales 
F puede determinarse si el efecto individual de una variable de prediccion en pre- 
sencia de las demas es estadisticamente discernible. Debe notarse que al intercambiar 
el orden de entrada al modelo para las variables de prediccion, entonces es posible 
identificar otras relaciones similares a (14.24)-(14.26). Por ejemplo, 


SCR(jc, , jc 2 , jc 3 ) =SCR(.c 2 ) -t- SCR (jc, | jc 2 ) + SCR(jc 3 ) jc 2 , jc, ) 
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es otra separaci6n de SCR(x t , x 2y x J ) r Conforme crece el numero de variables de 
prediccibn, el numero posible de separaciones se vuelve mas grande. 

Con base en lo anterior, puede explicarse ahora, para los datos de Prater dados en 
la seccibn anterior, la informacibn que aparece en la parte media de la figura 14.1. 
El lector notary dos columnas identificadas como “SC tipo I” y “SC tipo IV”. La 
de tipo I contiene las cuatro componentes de SCR (jc, , x 2 , jc 3 , x 4 ) , tales que 

" \ • ‘ 

SCR(jc,, x 2 , x Jy jc 4 ) = SCR(x,) + SCR(x 2 |jC|) 

+ SCR(x 3 | x ,, x 2 ) + SCR(x 4 | x ,, x 2 , x 3 ). 

Cada componente tiene un grado de libertad y representa la reduccibn en la suma de 
los cuadrados de los errores cuando se aflade al modelo la variable indentificada. El 
orden de entrada de variables al modelo es el mismo para el cual fueron identificadas 
las variables de prediccibn por el usuario, asi que 

SCR(x,) = 216.26, 

SCROTI*,) = 309.85, 

SCR(jc 3 | jc, , x 2 ) = 29.21, 

SCR(jc 4 | X|, x 2 , jc 3 ) = 2873.95. 


Las dos columnas que se encuentran inmediatamente a la derecha de la columna 
que corresponde a “SC tipo I”, dan los valores de las pruebas F parciales y los valo- 
res correspondientes p para cada una de las cuatro componentes. A partir de esta in¬ 
formacibn, es claro que el efecto individual de cada coeficiente de regresibn en pre- 
sencia de otros terminos en el modelo es estadisticamente apreciable. 

La SC tipo IV representa la reduccion en la suma de los cuadrados de los errores 
debida a la edicibn, en el modelo, de la variable de prediccion correspondiente, dado 
que las otras tres ya se encuentran en el mismo. Para el ejemplo, las componentes 
son 


SCR(jc, | jc 2 , jc 3 , x 4 ) = 25.82, 

SCR(x 2 J jc, , x } , x A ) = 11.20, ^ 

SCR(x 3 | x,, jc 2 , x A ) = 130.68, 

SCR(jc 4 | jc, , jc 2 , jc 3 ) = 2873.95. 

Nbtese que no existe ninguna razon tebrica para que la suma de estas cuatro compo¬ 
nentes sea igual a SCR (x it x 2 , x 3 , x 4 ). 

Con base en los valores de las pruebas F parciales para estas componentes, es cla- 
ra la existencia de cierta discrepancia entre estos resultados y los que se tienen para 
SC tipo I. Por ejemplo, la contribucion de x 2 en presencia solo de x r es estadistica¬ 
mente discernible, pero no puede decirse lo mismo de la contribucion de x 2 en pre¬ 
sencia de x,, x 3 y x 4 . 
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14.4 El problema de la multicolinealidad 

Es muy comun obtener conclusiones equivocadas con un punto de vista casual para 
la aplicadon de analisis de regresidn, cuando no se tiene una completa apretiation de 
los problemas que pueden encontrarse. En la seccidn anterior se notaron varias de las 
discrepancias que pueden presentarse en la regresidn lineal multiple, fistas pro- 
porcionan informacidn valiosa para identificar problemas que necesitan una aten- 
cion adicional. El enfoque para el an&lisis de regresidn no debe ser simplemente 
maximizar el coeficiente de correlacion multiple sin tomar en cuenta la debida consi- 
deracidn de los coeficientes de regresidn estimados y sus desviaciones estandar, o la 
de comprobar las suposiciones fundamentales del analisis de regresidn. 

Un problema frecuente en regresidn lineal multiple es el que algunas de la varia¬ 
bles de prediccidn estan correlacionadas. Si la correlacidn es pequefla, las consecuen- 
cias serin de indole menor. Sin embargo, si existe una correlacidn muy fuerte entre 
dos o mas variables de prediccidn, los resultados de la regresidn seran ambiguos, es- 
pecialmente con respecto a los valores de los coeficientes de regresidn estimados. Un 
coeficiente de correlacidn muy alto entre dos o mas variables de prediccidn constitu- 
ye lo que se conoce como multicolinealidad. Este problema muchas veces es dificil 
de detectar ya que surge como consecuencia de datos defidentes. Este es el precio 
que se paga cuando no es posible diseflar los experimentos en forma estadistica y re- 
cabar los datos en arreglos balanceados, tal como se analizo en el capitulo 12. 

Recuerdese que la ecuacion de prediccidn, a pesar de que no es precisa en un sen- 
tido fisico, debe ser un medio, empirico, viable para predecir la respuesta promedio 
dada una condicion de las variables de prediccidn. La multicolinealidad no impide 
tener un buen ajuste ni evita que la respuesta sea, en forma adecuada, predicha 
dentro del intervalo de las observaciones; lo que sucede es que esta afecta en forma 
severa las estimaciones de minimos cuadrados, ya que bajo los efectos de la multico¬ 
linealidad estas tienden a ser menos precisas para los efectos individuates de las va¬ 
riables de prediccidn, es decir, cuando dos o mas variables de prediccidn son colinea- 
les los coeficientes de regresidn estimados no miden los efectos individuals sobre la 
respuesta, sino que reflejan un efecto partial sobre la misma, sujeto a todo lo que 
pase con las demas variables de prediccidn en la ecuacion de regresidn. 

Para apreciar la naturaleza de la multicolinealidad, primero se estudiar& una si¬ 
tuation en la que esta no existe. Considerese un modelo de regresidn con dos varia¬ 
bles de prediccidn. Si el coeficiente de correlacidn simple entre las dos variables es 
cero, entonces se dice que las variables son ortogonales* A1 tener variables de pre¬ 
diccidn ortogonales el efecto que una de estas tiene sobre la respuesta dada se mide 
en forma totalmente independiente del efecto individual que la otra variable tiene 
sobre la misma respuesta. Si una o ambas variables de prediccidn se encuentran en la 
ecuacion de regresidn, las estimaciones de minimos cuadrados no cambiaran su 
valor 


* Una de las principals razones para disefiar experimentos en forma estadistica es la de adquirir factores 
o variables que sean ortogonales. Para muchos de los experimentos que emplean el analisis de varianza, 
los factores son ortogonales. 
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TABLA 14.6 Datos de la muestra para el ejemplo 14.2 


Y(° F) 

*,(°F) 

x 2 (%) 

66 

70 

20 

72 

75 

20 

77 

80 

20 

67 

70 

30 

73 

75 

30 

78 

80 

30 

68 

70 

40 

• 74 

75 

40 

79 

80 

40 


Fuente: Servicio Climatologico Nacional. 


Ejemplo 14.2 Para ilustrar los efectos ortogonales se examinar&n los datos (limita- 
dos) que aparecen en la tabla 14.6 que consisten en la temperatura aparente Y (que 
tan caliente se siente) como una funcion de la temperatura del aire x 1 y de la hume- 
dad relativa x Y 

El lector no tendra ningun problema pra verificar que el coeficiente de correla¬ 
tion entre x, y x 2 tiene un valor de cero. Se procedera a ajustar los modelos 
Y = f. 3 0 + /3,x, + e, Y = l 3 0 + fl 2 x 2 + e, y Y = /3 0 + /3,xj + /3 2 x 2 + e - La 
information relevante se encuentra en la tabla 14.7. 

Notese que los coeficientes de regresion estimados para x, y x 2 son 1.10 y 0.10, 
respectivamente, sin importar que una o ambas variables de prediction se encuen- 
tren en la ecuaciOn de regresiOn. De esta forma, por cada grado que aumenta la tem¬ 
peratura del aire, la temperatura aparente aumenta en 1.10 grados, y por cada incre- 
mento en porcentaje de la humedad relativa, la temperatura aparente aumenta 0.10 
grados.* Ademas, notese que 

SCR(x 2 1 x,) = SCR(x 2 ), 

SCRlt,, x : ) - SCR(.r,) + SCR(jc 2 ). 


Los resultados anteriores son los que se esperan cuando las variables de prediction 
son ortogonales y no existe multicolinealidad. 

Si se consideran de nuevo los datos de Prater y las regresiones que incluyen ax 2 o 
x v dadas en la tabla 14.3, se mostrara que existe una razon para sospechar la exis- 
tencia de multicolinealidad entre x 2 y x r Primero, nOtese que el coeficiente de regre- 
siOn estimado para x 2 es 1.57 cuando sOlo se encuentra presente en la ecuacion de 
regresion x 2 , perosu valor es de2.26 cuando se anadex r De manera similar, el coefi¬ 
ciente de x, es -0.09 para el modelo de linea recta, pero este cambia tanto en signo 
como en valor para ser igual a 0.05 cuando tambien se incluye a x 2 en la ecuaciOn de 
regresiOn. Segundo, es claro que la reduction en el valor de la suma de los cuadrados 


El lector no debe generalizar de estos resultados por lo Limitado de los datos. 
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TABLA 14.7 Ecuaciones de regresidn estimadas y tablas ANOVA para la temperatura apa- 
rente, tomandoax, y/ox 2 . 




y = -9.83 

+ l.lOx, 


Fuente de 
variacidn 

gl 

SC 

CM 

Valor F 

Regresidn 

1 

SCR(x,) = 181.5 

CMR(x,) = 181.5 

195.46 

Error 

7 

SCE lx,) = 6.5 

CME(x,) = 0.9286 


Total 

8 

STC = 188.0 

fa. 95.i,7 = 5.59 




y = 69.67 

+ 0.10x 2 


Fuente de 
variacidn 

gl 

SC 

CM 

Valor F 

Regresion 

1 

SCR (x 2 ) = 6.0 

CMR (x 2 ) = 6.0 

0.23 

Error 

7 

SCE (x 2 ) = 182.0 

CME (x 2 ) = 26.0 


Total 

8 

STC = 188.0 

/o,95, 1,7 = 5.59 




y = 12.83 + 1. 

lOx, + 0.10x 2 

- 

Fuente de 
variacidn 

gl 

SC 

CM 

Valor F 

Regresion 

2 

SCR(x,, jc 2 ) = 187.5 

CMR (x,, x 2 ) = 93.75 

1125.0 

q 

1 

SCR(X|) = 181.5 

CMR(X|) = 181.5 

2178.0 

x 2 | X, 

1 

SCR (x 2 | x,) = 6.0 

CMR (x 2 | x,) = 6.0 

72.0 

Error 

6 

SSE(x,, x 2 ) = 0.5 

CME (x,, x 2 ) = 0.0833 


Total 

8 

STC = 188.0 

fj.95, 2, 6 = 5.14, /o.95. 

,.6 =* 5.99 


de los errores debida a x } cuando x 2 se encuentra en el modelo, SCR( x, j x 2 ) = 21.75 
es mucho menor que cuando solo se encuentra x } en el modelo, SCR( x 3 ) = 353.70. 
La fuerte correlacidn que en forma aparente existe entre x 2 y x 3 ha disminuido de 
manera drastica el efecto individual que sobre la respuesta tiene x } en presencia 
de x 2 . Puede hacerse el mismo comentario con respecto al efecto de x 2 , ya que este 
es estadisticamente apreciable en ausencia de x } (SCR(xJ = 525.74, / = 5.19), 
pero se encuentra sustancialmente disminuido cuando x 3 se encuentra presente 
( SCR(x 2 | x,) = 193.79). 

Para mostrar que existe una fuerte correlacion entre x 2 y x 3 , se determinant la 
matriz de correlacion para las cuatro variables de prediction de los datos de Prater. 
Esta matriz contiene todos los pares posibles de coeficientes de correlacion y puede 
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determinarse para un conjunto dado de variables en forma muy f&cil mediante el 
empleo de un paquete para computadora.* La matriz de correlacidn para jc, , x 2 , x y , 
y x 4 es la siguiente: 



x, 

x 2 

% 

X 4 

X\ 

1.00 

0.62 

-0.70 

0.32 

*2 

0.62 

1.00 

-0.91 

0.30 

*3 

-0.70 

-0.91 

1.00 

0.41 

*4 

-0.32 

-0.30 

0.41 

1.00 


Notese que el valor de cada uno de los elementos que se encuentran en la diago¬ 
nal es uno, ya que cada variable se encuentra correlacionada de manera perfecta 
consigo misma. Los elementos que se encuentran fuera de la diagonal son los valores 
de los coeficientes de correlacion simple. Por ejemplo, r l2 = 0.62 es el coficiente de 
correlacion entre x 10 y x y por lo tanto, el valor r n = -0.91 al encontrarse muy 
cercano a -1 sugiere una fuerte asociacidn lineal entre x 2 y x r Este resultado es pre- 
decible si se inspeccionan en forma visual los datos dados en el ejemplo 14.1. N6tese 
que conforme aumenta la presion de vapor del petroleo crudox 2 , el punto x 3 ASTM 
10% disminuye y viceversa. Estos resultados proporcionan la causa para sospechar 
la presencia de multicolinealidad en este ejemplo. 

iQue es lo que se puede hacer cuando se descubre la presencia de multicolineali¬ 
dad? Una alternativa es la de afiadir puntos de observation para las variables coli- 
neales, los cuales tiendan a disminuir la severidad de la correlation. Pero puede 
ocurrir que estos puntos de observation no se encuentren disponibles facilmente. 
Por ejemplo, para los datos de la gasolina podrian no existir los tipos de petroleo 
crudo que pueden cfisminuir la fuerte linealidad que existe entre x 2 y x y Una segunda 
alternativa es la de omitir una o mas de las variables que son colineales, lo que reduce 
la variabilidad de los coeficientes de regresiOn de las restantes variables. Se handesa- 
rrollado enfoques m4s sofisticados para resolver los problemas que plantea la mul¬ 
ticolinealidad, incluyendo la regresion por componentes principals y la regresiOn 
ridge. Estos temas se encuentran mas all k del objetivo de este libro; se invita al lector 
a que consulte las referencias [1] y [3]. 

Para ilustrar la segunda alternativa y resolver el problema de la multicolineali¬ 
dad, se examinaran las regresiones para las cuales se omiten x 2 o x y Como compara- 
ciOn, tambien se considerara la regresion de la production de gasolina con respecto 
solo al punto (x^ASTM 10% y al punto final (jc 4 ). Sin proporcionar argumentation 
adicional se piensa que estas tres regresiones son las candidatas para la “mejor” 
ecuacion de regresion lineal para los datos de Prater. La informacion mas importan- 
te se encuentra en la tabla 14.8. 

Al comparar parece que la regresion de Y solo sobre x } y es la mejor con respec¬ 
to a las proporcionadas por los otros dos modelos. Para el modelo b, la desviacion es- 
tandar del estimador por minimos cuadrados para el termino constante es muy gran- 


* Para S/4S puede ser apropiado utilizar PROC CORR. 
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TABLA 14.8 Candidates para la mejor ecuaci6n de regresidn para los datos de Prater 


a) Regresidn de Y sobre jc, , x 2 , x 4 


Variable 

Coeficiente 
de regresidn estimado 

Desviacidn 
estandar estimado 

Valor t 

Constante 

'-53.899 


5.8135 

-9.27 


0.422 


0.1273 

3.32 

*2 

2.154 


0.2716 

7.93 

X4 

0.144 


0.0084 

17.10 


R 2 = 0.9255 


*0.975, 28 = 2.048 




ANOVA 



Fuente 

gl 

SC 

CM 

Valor F 

Regresidn 

3 

3298.60 

1099.53 

115.97 

x, 

1 

216.26 

216.26 

22.81 

x 2 | 

1 

309.85 

309.85 

32.68 

x 4 | *1 , *2 

1 

2772.49 

2772.49 

292.41 

Error 

28 

265.48 

9.48 


Total 

31 

3564.08 

fo. 95,3,28 = 2.95;_/o.95. 

i. 28 = 4.20 

b) Regresidn de Y sobre x t , x 2 , x 4 


Coeficiente 


Desviacidn 


Variable 

de regresidn estimado 

estandar estimada 

Valor t 

Constante 

4.032 


7.2233 

0.56 

Xl 

0.222 


0.1021 

2.17 

X) 

-0.187 


0.0159 

-11.72 

x 4 

0.157 


0.0065 

24.22 


R 2 = 0.959 


*0.975. 28 = 2.048 




ANOVA 



Fuente 

gl 

SC 

CM 

Valor F 

Regresidn 

3 

3418.08 

1139.38 

218.51 

-V| 

1 

216.26 

216.26 

41.47 

*3 | V| 

1 

142.08 

142.08 

27.25 

r 4 | x u -r } 

1 

3059.74 

3059.74 

586.79 

Error 

28 

146.00 

5.21 


Total 

31 

3564.08 

fo.95. 3. 28 = 2.95; ^0.95. 

,.28 = 4.20 


(continua•) 
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TABLA 14.8 '.(continuacidn) 


c) Regresidn de Y sobre x } , x K 


Variable 

Coeficiente 
de regresidn estimado 

' Desviacidn 
estdndar estimada 

Valor t 

Constante 

18.468 


\ 3.0090 

6.14 

X) 

-0.209 


0.0127 

-16.43 

X 4 

0.156 


0.0069 

22.73 


, R 2 = 0.9521 

*0.975. 29 - 2.045 




ANOVA 



Fuente 

gl 

SC 

CM 

Valor F 

Regresidn 

2 

3393.47 

16%.73 

228.41 

*3 

1 

353.70 

353.70 

60.12 

x 4 | x 3 

1 

3039.77 

3039.77 

516.69 

Error 

29 

170.61 

5.88 


Total 

31 

3564.08 

fo. 95. 2 , 29 = 3.33; f) 95 | 

.29 = 4.18 


de, y la desviacion estandar del coeficiente x t es casi igual a la mitad del valor de este. 
Para el modelo a, R 2 = 0.9255, mientras que para el modelo c, R 2 = 0.9521, el 
cual es un valor mucho mas cercano al valor de R 2 cuando todas las variables de pre¬ 
diccidn figuran en la ecuacion de regresion. Ademas, las desviaciones estandar de los 
coeficientes de regresion estimados son, en forma relativa, mejores para el modelo c 
que para el b. Para finalizar, los factores fisicos claves como la consistencia logica 
de los coeficientes de regresion estimados, son los que por lo general definen la elec- 
cion final. 


14.5 Determination del mejor conjunto de variables de prediction 

Un problema muy importante en el analisis de regresion es determinar cuales de las 
variables de prediction en la lista inicial deberanincluirse en el modelo de regresion. 
En casi todas las ocasiones, un investigador decidira, de una lista inicial de variables 
de prediccidn, a aquellas que tienen la mayor probabilidad de contener los factores 
mas importantes para la respuesta dada. Por lo tanto, es necesario tener una manera 
de determinar, de la lista inicial de variables de prediccion, a aquellas que parecen 
ser las mejores para describir el cambio en la respuesta promedio, y de esta forma 
proporcionaran una ecuacion de prediccidn representativa de las condiciones bajo 
las cuales se recabaron los datos. La palabra “mejores” no debe interpretarse como 
poseedora de la connotacion teorica de optimo; esta debe considerarse como repre¬ 
sentativa de los medios por los cuales se aislan las caracteristicas mas sobresalientes, 
de tal manera que puede llevarse a cabo un analisis significativo. 
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Sea k el numero inicial de potenciales variables de prediction; el numero de termi- 
nos en el modelo lineal completo, incluyendo al termino constante, es m = k + 1. 
Un procedimiento que es muy reconrendable para deferminar el mejor conjunto de 
variables de prediccibn por incluir en la ecuacibn de regresibn es calcular y comparar 
todas las posibles 2* ecuaciones de regresibn. Con este proceso se tendra una 
ecuacion, la cual no contiene ninguna variable de prediction (T = Y), it ecuaciones 
cada una con una variable de prediccibn, k{k - l)/2 ecuaciones con dos variables de 
prediction y asi sucesivamente. El procedimiento proporciona al investigador la 
oportunidad de evaluar y comparar todas las ecuaciones de regresibn y, con base en 
la investigacion de todas las discrepantias aparentes, debe surgir la mejor ecuacion. 
Dado que hoy en dia la capacidad de cbmputo es muy extensa, la determinacion de 
todas las posibles ecuaciones de regresibn es el mejor metodo, aun si k tiene un valor 
tan grande como 9 o 10. 

Cuando k es grande, puede no ser practico determinar y evaluar todas las posi¬ 
bles ecuaciones de regresibn. Fura estos casos, se han desarrollado tecnicas para Ip 
seleccon de las variables que pueden proporcionar al usuario informacion muy util, 
sin tener que evaluar todas las posibles ecuaciones de regresibn. Sin embargo, estas 
tecnicas tienen algunos inconvenientes y no deben considerarse como iguales con 
respecto a la evaluation de todas las posibles regresiones. Mientras que los procedi- 
mientos para la seleccibn de variables dan resultados confiables, cuando la muticoli- 
nealidad no es problema, estos produciran resultados contradictorios para datos co- 
lineales. De esta forma, si se sospecha la presencia de multicolinealidad, no deberim 
emplearse metodos para la seleccibn de variables. La tecnica mas usual de seleccibn 
de variables emplea un procedimiento de regresidn por pasos para obtener la mejor 
ecuacion de regresibn. Existen dos versiones principales de esta tecnica: la seleccibn 
hacia adelante y la eliminacibn hacia atras. 

El procedimiento de seleccibn hacia adelante comienza con una ecuacion que no 
contiene variables de prediccibn. La primera variable incluida en la ecuacion es 
aquella que produce la mayor reduccibn en el valor de la suma de lbs cuadrados de 
los errores; esta es la variable de prediccibn con el coeficiente de correlation simple 
mas alto para la respuesta dada. Con base en una prueba de hipotesis, si el coeficien¬ 
te de regresibn es significativamente diferente de cero, la variable permanece en la 
ecuacibn y se comienza la busqueda de una segunda variable. La segiyida variable 
por incluir en la ecuacibn es aquella que produce la mayor reduccibn en la suma de 
los cuadrados de los errores, dada la presencia de la primera variable.* Esta es la va¬ 
riable que posee el coeficiente de correlacibn mas alto con la respuesta, despues de 
que esta se ha ajustado para tomar en cuenta el efecto de la primera variable. Si la 
significancia estadistica es discernible para el coeficiente de regresibn de la segunda 
variable, esta se mantiene en la ecuacibn y se comienza la busqueda de una tercera 
variable de prediccibn. El proceso se continua de esta forma hasta que la significan¬ 
cia estadistica no sea discernible para el coeficiente de la ultima variable que ha 
entrado a la ecuacibn. 

El procedimiento de eliminacibn hacia atras comienza con la ecuacibn de regre¬ 
sibn que contiene a todas las variables de prediccibn. Entonces se eliminan, una a la 

* En este momento pueden surgir dificuitades cuando los datos son colineales. 
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vez, las variables menos importantes con base en su contribution a la reduccibn en el 
valor de la suma de los cuadrados de los errores. Por ejemplo, la primera variable 
por omitir sera aquella cuyo efecto sobre la reduccion en el valor de la suma de los 
cuadrados de los errores, dada la presencia de las demas variables, sea el mas peque- 
flo. El procedimiento concluye cuando los coeficientes de todas las variables que aun 
permanecen en la ecuacibn tienen una significancia estadisticamente discernible. 

El procedimiento de seleccibn hacia adelante se ha modificado de tal manera que 
se considere la posibilidad de eliminar una variable en cada etapa. Esta modificacibn 
da origen a lo que en forma usual se conoce en los paquetes de computacibn como 
procedimiento de regresibn por pasos (stepwise). Con este metodo puede eliminarse, 
en una etapa posterior, una variable de prediccibn cuya inclusion se llevb a cabo en 
una etapa anterior. De nuevo, el proceso de decisibn se basa en la reduccibn en el 
valor de la suma de los cuadrados de los errores y de las pruebas F parciales y depen- 
de de la combinacibn particular de las variables que se tienen en la ecuacibn de regre¬ 
sibn. 

Con el desarrollo de paquetes para computadora cada vez mac elaborados se 
tienen disponibles otras tecnicas, pero la caracteristica comun sigue siendo el valor 
de la suma de los cuadrados de los errores cuando una variable entra a (o es removi- 
da de) la regresibn, dada la presencia de las demas variables de prediccibn. Para 
datos “con buen comportamiento”, los procedimientos de regresibn por pasos y de 
eliminacibn hacia atras en general proporcionan los mismos resultados. Si existe algu- 
na diferencia entre estos, este hecho muchas veces constituye una buena indicacibn 
para considerar el problema con mayor cuidado, asi como la realizacion de analisis 
adicionales. 

Para evaluar y comparar las ecuaciones de regresibn, de manera especial dentro 
del contexto de todas las posibles regresiones, es necesario tener criterios efectivos. 
Dos de los criterios mas utiles son el del cuadrado medio del error (CME) y el criterio 
C p . Con el proposito de tener un panorama mas completo, tambien se estudiara el 
coeficiente de correlacion multiple R 2 . 

1. El criterio del cuadrado medio del error. Recuerdese que el cuadrado medio 
del error es igual a la varianza residual. Dado que CME es la suma de los cuadrados 
de los residuos dividida entre el numero de grados de libertad de SCE, CME toma en 
cuenta el numero de parametros en el modelo a traves del numero de grados de liber¬ 
tad. Mientras que la suma de los cuadrados de los errores no puede aumentar si se 
permiten mas variables en el modelo, no ocurre lo mismo con el cuadrado medio del 
error si la reduccibn en el valor de SCE es tan pequena que no pueda compensar 
la perdida del numero de grados de libertad adicionales. Por ejemplo, recuerdese la 
tabla 14.3 y en particular los modelos aye. Notese que SCE (x 2 ) = 3038.34 es 
mayor que SCE (.v 2 , x } ) = 3016.59, pero CME (,r 2 ) = 101.28 es menor que 
(,r 2 , x y ) = 104.02. Con el criterio CME puede determinarse el conjunto de va¬ 
riables de prediccibn que minimice a CME o casi lo haga en el momento para el que 
la introduccion de mas variables de prediccibn en la ecuacibn de regresibn ya no se 
encuentre garantizada. 

2. El criterio C p . Recuerdese que la varianza residual S 2 es un estimador no ses- 
gado de la varianza del error cr solo cuando se ha escogido la forma correcta para el 
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modelo de regresidn. De otra forma, puede demostrarse que 

2 A? \ 

E(S 2 ) = <r 2 + f^ --• (14.27) 

(n - p) 

I v 

donde p es el numero de terminos que aparecen en el modelo, incluido el termino 
constante y 

A, = E{ YJ - E(Yj) 

es el sesgo. 

Supongase que la ecuacidn de regresion, la cual contiene k variables de predic¬ 
tion, se ha escogido en forma cuidadosa, de tal manera que CME = S 2 es un estima- 
dor no sesgado de a 2 . Pero para cualquier ecuacidn de regresidn que sdlo contenga a 
un subconjunto de las k variables de prediccidn, es posible que A, / 0, y las predic- 
ciones de la respuesta con base en la ecuacidn de regresidn estimada pueden en- 
contrarse sesgadas. Para evaluar la efectividad de esta ecuacidn de regresidn, 
como un medio para formular predicciones, debe considerarse el cuadrado medio 
del error de un valor predicho, mas que la varianza de este. El cuadrado medio del 
error total estandarizado que se define como 


r p = ~2 cme(}>;) 



r n n 


S A? + E Var(%) 

L-=l i=l 


(14.28) 


se ha propuesto como un criterio apropiado de la bondad del ajuste para una 
ecuacidn de regresidn estimada la cual contiene p terminos. La cantidad T p conside- 
ra tanto a la componente del sesgo en ya que algunas de las variables de predic¬ 
cidn no se encuentran incluidas, asi como a la varianza en Fj para todas las n obser- 
vaciones de la respuesta. A continuacidn se obtendra un estimador para T p . 

Puede demostrarse que 


X Var(Yi) = per 2 , 

i= 1 


lo cual implica que la varianza total de la prediccidn aumenta conforme el numero 
de terminos en la ecuacidn de regresidn tambien aumenta. A1 sustituir en (14.28), 
se tiene 

r P = \^A 2 + p. (14.29) 

a 1= I 

Dado que para una ecuacion de regresion que contiene p terminos 

SCE P = (n - p)S 2 p , 
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se tiene 


£(SCE P ) = (n - p)E(Sp) 


- (n - p) I a 2 + 


I A 2 


(n - p) 
~ ( n ~ P)v 2 + 2 A 2 , 


2 A? = £(SCE P ) - (n-p)c t 2 . 

A1 sustituir en (14.29), se obtierie 


^ £(SCE P ) - (n - p)a- , 

11 - ■> ' P 


u 


E( SCE P ) 
a 2 

E( SCEp) 


- (n - p) + p 


- (n - 2 p). 


Dado que SCE p es un estimador de £(SCE p )y S ] lo es a su vez de cr 2 , un estimador 

CSE„ 


de F p es la estadistica 


C„ - ~(n - 2 p). 


(14.30) 


N6tese que SCE p es la suma de los cuadrados de los errores para la ecuacion de re- 
gresibn, la cual contiene p terminos y que S 2 k = CMECr, , x 2 , .... x k ) es el estimador 
de cr 2 basado en todas las k variables de prediccion. 

Los valores deseables para C p para la bondad del ajuste de una ecuacibn de re 
gresion que contiene p terminos son aquellos que se encuentran muy cercanos a p. 
Lo anterior surge del hecho de que si el sesgo de una ecuacion de regresion de p ter¬ 
minos es despreciable E A 2 = 0 y £(SCE P ) = (n - p)cr 2 . Bajo esta condicion, 
el valor esperado de la estadistica C p es 

E(C P | A,- = 0) - ( " ~ ^ )q ~ - (n - 2p) 
a" 


= P- 

De esta forma, cuando se obtienen todas las posibles regresiones, se calcula un valor 
de Cp para cada caso. Las regresiones que tienen valores de C p cercanos a p se consi- 
deran como deseables. 

Puede ser benefico aceptar un pequeno sesgo en la prediccion, mediante la elimi- 
nacion de alguras variables de prediccion, aun si sus coeficientes de regresion son es- 

www. FreeLibros. com 


530 Analisis de regresidn: el modelo lineal general 

tadisticamente significativos, con excepci6n de los que tienen un valor igual a 
cero. Lo anterior es especialmente cierto si los coeficientes de regresidn del nuevo 
modelo se estiman con varianzas pequefias; ademas, dado que la varianza total de la 
prediccidn aumenta conforme se afiaden m4s variables al modelo de regresidn, 
puede ser ventajoso eliminar algunas variables con el proposito de disminuir el error 
promedio de la prediccidn. 

Ademas de considerar a CME y a C p , tambien se debe considerar el coeficiente de 
correlacidn multiple K 2 para evaluar las ecuaciones de regresidn. Dado que R 2 varia 
en forma inversa a como lo hace la suma de los cuadrados de los errores, R 2 aumen- 
tara conforme se afladan mas variables al modelo de regresidn y R 2 alcanzara su 
valor m&ximo cuando todas las variables de prediccidn se encuentren en la ecuacidn 
de regresidn. Por lo tanto, la razdn para emplear a R 2 como un criterio, no es la de 
encontrar el conjunto de variables que maximiza R 2 , sino mas bien determinar el 
punto m<is allA del cual sumar m£s variables no es deseable, ya que el incremento que 
se tiene en R 2 es minimo. 

Para proporcionar una ilustracidn de todas las posibles regresiones y sus compa- 
raciones, tomando en cuenta los criterios anteriores, de nuevo considerense los datos 
de Prater. La tabla 14.9 contiene las estimaciones por minimos cuadrados para los 
coeficientes de cada regresidn (distintas de la trivial y, = y = 19.66), y la tabla 
14.10 identifica los correspondientes valores de SCE, CME, C p y R 2 . 

El cuadrado medio del error cuando las cuatro variables de prediccidn se encuen- 
tran en el modelo de regresidn es CME(*i, x 2 , x 3 , .r 4 ) = 4.99. De esta forma, por 
ejemplo, para obtener el valor de C p para la regresidn de Y sobre x, , x 3 , y x 4 ,se 
tiene que SCE (as, x 3 , x 4 ) = 146.00, p = 4, n = 32 y 

146 

= AM ' (32 " 8) = 5 - 26 - 


TABLA 14.9 Todas las regresiones posibles para los datos de Prater 


Variables de prediccidn 
en el modelo 

bo 

b , 

b 2 

bx 

b A 

x, 

1.264 

0.469 




x-> 

13.087 


1.572 



-Vi 

41.389 



-0.090 


X 4 

- 16.662 




0.019 

-v, . .v : 

12.256 

0.025 

1.539 



V| . v< 

35.174 

0.096 


-0.080 


A 1 • A 4 

-64.951 

1.009 



0.136 

AS. X, 

- 2.524 


2.257 

0.053 


A - ; • X 4 

-37.808 


2.677 


0.139 

AS. V 4 

18.468 



-0.209 

0.156 

A i, AS , V, 

-11.013 

0.125 

2.278 

0.067 


A , . AS . ,V 4 

-53.899 

0.422 

2.154 


0.144 

A'l . AS, AS 

4.032 

0.222 


-0.187 

0.157 

A ', A'i, A 4 

8.562 


0.523 

-0.175 

0.154 

A,. AS, Aj, ,V 4 

- 6.821 

0.227 

0.554 

-0.150 

0.155 
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TABLA 14.10 Criterios de bondad de ajuste para todas las posibles regresiones para los da- 
tos de Prater • \ >i-: ‘"‘U'nitnxi--: .< o mm j 


Variables de prediccidn 

R 2 ' 

SCE 

■ , ' 7u ; > 

x ' \ 

0.0607 

3347.82 

111.59 

642.91 

0.1475 

. 3038.34 

101.28 

580.89 

*3 

0.0992 

Y 3210.38 

107.01 -. 

V 615.36 

*4 

0.5063 

1759.69 

58.66 

.. ,_324.64 * 

x,,x 2 

0.1476 

3037.97 

104.76 

582.81 

x ,, X 3 

0.1005 

3205.74 

110.54 

616.43 

*1, *4 

0.7582 

861.95 

29.72 

' 146.74 

x 2 , x } 

0.1536 

3016.59 

104.02 

578.53 

x 2 , x 4 

0.8962 

369.87 

12.75 

48.12 

X}, X 4 

0.9521 

170.61 

5.88 

8.19 

X ,, X 2 , X, 

0.1558 

3008.76 

107.46 

578.96 

X u JC 2 , ^4 

0.9255 

265.48 

9.48 

29.20 

Jf,, X, , x 4 

0.9590 

146.00 

5.21 

5.26 

x 2 , x,, x 4 

0 9549 

160.62 

5.74 

8.19 

X,, X 2 , X 3 , x 4 

0.9622 

134.80 

4.99 

5.00 


A1 tomar en cuenta, tanto a CME como C p , la mejor ecuaci 6 n de prediction 
para la production de gasolina debe seleccionarse de las regiones que incluyen 
(jc 3 , x 4 ), (jc, , JC 3 ., x 4 ), (x 2 , x 3 , x 4 ), y (x,, x 2 , Xj, x 4 ). Esta ultima no es en particular atrac- 
tiva, ya que las estimaciones de los coeficientes de regresibn para el termino constante y 
para x 2 tienen desviaciones estandar muy grandes. A pesar de que la ecuacibn de re- 
gresion que contenga x 2 , x 3 , y x 4 tiene valores de CME y C p muy cercanos a los bp- 
timos, esta carece de una precision satisfactoria para la estimacion del coeficiente de 
x v dado que b 2 = 0.523, con s(B 2 ) = 0.396. Puede decirse lo mismo de la regre- 
sion que comprenda a x,, x 3 , y x 4 para las estimaciones de /3 0 y del coeficiente de x, 
(vease el modelo b en la tabla 14.8).De acuerdo con lo anterior, se acepta un peque- 
fto sesgo en la prediccion y se concluye que la ecuacion de regresibn que contiene a x z 
y a x 4 es la mejor para predecir la produccibn de gasolina en el intervalo de valores 
de las observaciones. 

A continuacion se dan las etapas por seguir en un procedimiento de regresibn 
paso a paso: 

1. El procedimiento comienza mediante la obtencion de k ecuaciones de regresibn li¬ 
neal simples. 

La estadistica F 


F = CMR(r j )/CME(;t,) 

se calcula para cada i = 1, 2, ..., k variables. Si el mayor valor Fexcede un ni- 
vel de significancia estadistica, previamente determinado, la variable correspon- 
diente es la primera que se incluye en la regresibn. De otro modo, la mejor 
ecuacion es Y = Y. Este proceso es identico al que se sigue para determinar la 
variable de prediccion que tiene la mayor correlacion con la respuesta. 
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2. Supbngase que la variable x, entra a la ecuacibn de regresibn en el paso 1. En este 

momento, el procedimiento de regresibn paso a paso calcula todas las ecuaciones 
que contienen dos variables, incluyendo a x y Para cada caso, el valor de la esta- 
distica F parcial \ - • 

F = CMR(x, | x 3 )/CME(x,, x 3 ) 

» 

se calcula para determinar si puede rechazarse H 0 : = 0 en presencia de x y Si 

el mayor valor de F es suficiente para la significancia estadistica, la segunda va¬ 
riable correspondiente se aflade a la ecuacion. 

3. Supongase que se aflade x, a la ecuacion en el paso 2. El procedimiento continua 
mediante un examen para determinar si alguna de las otras variables que ya se en- 
cuentran en la ecuacion debe eliminarse ahora; en este caso, esta podria ser x y Se 
calcula el valor de la estadistica F parcial 

F = CMR(x 3 | x,)/Cr»IE(. M , jc 3 ) 

y se compara con un nivel predeterminado de significancia. Si el efecto de x, dado 
x, no es estadisticamente discernible, se elimina ax, de la ecuacion; de otro modo 
se retiene. Para etapas posteriores existira un cierto numero de las pruebas Fpar- 
ciales para todas las variables que se afiadieron en etapas anteriores. La variable 
que puede eliminarse es aquella para la que el valor de F es el mas pequeflo. 

4. Supbngase que se retiene a x,; en este momento la ecuacibn de regresibn incluye a 
x, y ax,. El proceso se continua mediante un examen para determinar cual de las 
variables restantes es candidata para incluirse en el modelo. Entonces, se examina 
si alguna de las variables que ya se encuentran incluidas debe eliminarse ahora. El 
proceso termina cuando ninguna de las demas variables de prediccibn puede afla- 
dirse o eliminarse del modelo de regresibn. 

Se deja como un ejercicio para el lector emplear los datos de produccion de ga- 
solina con todas las opciones de seleccion posibles de variables y se compararan los 
resultados. 


14.6 Analisis de residuos o residuales 

En la seccibn anterior se examinaron algunas formas para determinar la “mejor” 
ecuacibn de regresibn, bajo las circunstancias impuestas por el conjunto de datos. 
Una manera muy efectiva de detectar las posibles deficiencias de un modelo radica 
en llevar a cabo un analisis de residuos. Ningun otro aspecto es tan importante en el 
analisis de regresibn como el analisis de los residuos. El conocido economista Paul 
A. Samuelson comentaba: “al cientifico que hace predicciones le recomiendo que 
siempre estudie sus residuales”. 

Como se hizo notar en el capitulo 12, el analisis de los residuos puede descubrir 
las violaciones de las suposiciones o las deficiencias del modelo. Se examinaran tres 
deficiencias muy comunes: la ecuacibn de regresibn puede no ser lineal en las varia¬ 
bles de prediccibn; la varianza del error a 2 puede no ser constante y una o mas de las 
variables de prediccibn que ejercen una influencia importante pueden no estar in- 
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cluidas en el modelo. Tambibn se considerar4 el problema de las observaciones dis¬ 
crepant es o aberrantes, que son aquellas cuyos valores se encuentran alejados del 
comportamiento general del resto de los datos. 

Recuerdese que el /-esimo residuo e, es la diferencia numerica que existe entre el 
valor observado y, y el correspondiente valor estimado y ; , para toda / = 1,2,.... n. 
El residuo e t se considera como una estimacibn del verdadero error no observable 
e,. El error cuadr&tico medio es la varianza de los residuos, la que a su vez es una es¬ 
timacibn de or 2 . 

En esencia, el analisis de residuos significa realizar un analisis de sus gr&ficas de 
los residuos. Si se ha definido la ecuacion de regresibn en forma correcta y no existe 
ninguna deficiencia, entonces una grafica de los residuos contra cualesquiera de los 
valores estimados y, a los correspondientes valores de cada variable de prediction 
en la ecuacibn no mostrara ningun patron, es decir, no existira ninguna relacibn 
entre los residuos y los valores ajustados o entre los residuos y ios valores de las va¬ 
riables de prediccibn. Si existe alguna relacibn, esta sugerira el hecho de que hay una 
deficiencia en la ecuacion de regresion. Para detectar las breas de problemas a traves 
del an&lisis de los residuos, es preferible, de nuevo, emplear los residuos estandariza¬ 
dos. Dado que la media de los residuos es igual a cero, 

e„ = ejs 

de fine al /-esimo residuo estandarizado donde s es la desviacion estandar residual 
(VCME). Debe notarse que si el tamano de la muestra n es muy grande, la distribu- 
cibn de los residuos estandarizados debera encontrarse aproximada en forma ade- 
cuada por una distribucion normal estandar. De hecho, muchos investigadores han 
sugerido que cualquier alejamiento notable de la normalidad en la distribucibn de 
los residuos puede indicar una deficiencia en el modelo. 

Para determinar si un modelo de regresibn es lineal o no en las variables de pre- 
diccion, se grafican los residuos contra los correspondientes valores de cada una de 
las variables de prediccion que figuran en la ecuacion de regresibn. Para determinar si 
la varianza del error es o no constante, se grafican los residuos estandarizados 
contra los correspondientes valores estimados de la respuesta. Finalmente, para de¬ 
terminar si una variable de prediccion, potencialmente importante, debe incluirse o 
no en el modelo de regresibn, se grafican los residuos contra los valores de esta va¬ 
riable. Si la ecuacion de regresibn estimada esta practicamente libre de cualquier de¬ 
ficiencia o violacion de suposiciones, entonces los residuos estandarizados tenderan 
a encontrarse dentro de una banda horizontal centrada alrededor del valor cero, sin 
ninguna tendencia sistematica a ser positivos o negativos, y en forma muy rara se en- 
contraran fuera del intervalo ±3, Cualquier desviacibn significativa con respecto a 
este comportamiento indicara la existencia de un problema. 

La figura 14.2 representa algunas graficas usuales de residuos: a) cuando se en- 
cuentra presente un efecto cuadratico causado por una variable de prediccion y que 
debe incluirse en el modelo; b) cuando la varianza del error no es constante y deben 
emplearse minimos cuadrados con factores de peso (ponderados) para estimar los 
coeficientes de regresibn y c) cuando una variable que se ha eliminado muestra una 
fuerte asociacion (lineal) con los residuos y por lo tanto debe incluirse en el modelo 
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FIGURA 14,2 Graficas comunes de residuos para: a) ia presencia de un efecto cuadratico; 
b) la varianza no constante del error, y c) el efecto lineal de una variable omitida 


de regresion. Puede decirse mas con respecto a estos tres casos. Si la ecuacion de re¬ 
gresion contiene s61o un efecto lineal causado por una variable de prediction x, 
cuando en realidad existe un efecto cuadratico estadisticamente apreciable, entonces 
la grafica de los residuos estandarizados contra x sera una curva en forma de U (o de 
U invertida). Bajo un efecto cuadratico, los residuos correspondientes a los valores 
extremos de x tenderan a ser grandes y positivos (negativos), y los residuos que se en- 
cuentran en la parte media del intervalo de valores de x tenderan a ser pequefios pero 
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negativos (positivos). En general, mediarite la inclusi6n de un termino cuadr&tico de 
x en elmodelo, mejora considerablemente el valor predictivo de la ecuacion de re- 
gresion resultante con respecto a la ecuacibn previa. Los efectos de orden superior 
tambibn pueden detectarse de la misma manera. 

Si la gr&fica de los residuos da como resultado una figura en forma de cuAa, en- 
tonce^ es posible que la suposicibn de que la varianza del error es constante no se 
cumpla. En otras palabras, si existe urta tendencia a aumentar o disminuir los re¬ 
siduos estandarizados al aumentar los valores estimados de la respuesta, la varianza 
del error puede no ser constante. Esto da origen a lo que se conoce como modelo he- 
terocedastico. Para remediar esta situation se emplea el metodo de minimos cuadra- 
dos con fadores de peso, en donde los pesos son inversamente proporcionales a la 
varianza de los errores. De esta forma, en lugar de intentar determinar las estimacio- 
nes de los coeficientes de regresibn mediante la minimization de la suma de los cua- 
drados de los errores, se determina el conjunto de valores para los cuales la suma de 
pesos de los cuadrados de los errores es un minimo. El motivo para emplear mini¬ 
mos cuadrados con factores de peso en una situacibn heteroced&stica es estimar los 
coeficientes de regresibn con pequefias desviaciones lo que a su vez produce un me- 
jor ajuste. 

Si cuando los residuos estandarizados se grafican contra una variable que no for¬ 
ma parte de la ecuacibn de regresibn, pero bajo la cual se pudo observar la respues¬ 
ta, se observa una tendencia lineal (o de orden superior); entonces, como se mencio- 
n6 en el capitulo 13, los errores no pueden considerarse mas como independientes de 
esta variable. En general, este tipo de variable resulta ser un efecto demografico o re- 
lacionado con el tiempo. Por ejemplo, para muchos experimentos en los que los da- 
tos se observan durante un periodo significativo, el investigador podria inicialmente 
decidir no incluir al tiempo como una variable de prediccibn potencial. Pero si los re¬ 
siduos revelan un patron sistematico cuando se grafican contra el tiempo, la variable 
tiempo debera introducirse en la ecuacion de regresion. 

Las grbficas de residuos tambien son una ayuda al tratar con observaciones ex- 
tremas o discrepantes. En general, las observaciones extremas tienen residuos que 
son, en forma relativa, grandes, comparados con los de las dembs observaciones. En 
general, el valor del residuo estandarizado de una observation discrepante se en- 
contrara mas alia del intervalo _+3. Las observaciones discrepantes pueden crear si- 
tuaciones dificiles en una ecuacibn de regresion, debido a que tienen un efecto 
desproporcionado sobre los valores estimados de los coeficientes de regresibn. Re- 
cuerde que una de las suposiciones de la estimacibn por minimos cuadrados es que el 
conjunto de datos es tipico de la situacion para la cual se intenta identificar una buena 
ecuacibn de prediccibn. Por lo tanto, la remocion de cualquier observacion del con¬ 
junto de datos no tendra, en forma virtual, ningun efecto sobre la ecuacibn de regre¬ 
sibn. Lo anterior constituye precisamente el porque puede removerse, sblo con 
extremo cuidado, una observacion discrepante. Un metodo logico que se ha sugeri- 
do es remover una observacion discrepante sblo si existe evidencia comprobada de 
que esta es el producto de un error causado, por ejemplo, por un mal funcionamien- 
tQ del instrumento de medicion. En ausencia de clara evidencia de error, la observa- 
cibn discrepante puede ser informacion unica con respecto a la respuesta y ser vital 
para el entendimiento del fenomeno. 
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Los siguientes dos ejemplos ilustrar&n los casos a) y c) que se muestran en la figu- 
ra 14.2. El caso en el cual se tiene una varianza no constante se analizara en la sec- 
ci6n 14.8. . ■■ .. -; 

Ejemplo 14.3 Una compaftia manufacturera desea predecir el costo unitario de fa¬ 
brication Y de uno de sus productos como una f unci On de la tasa de production (que 
fluctua en el tiempo) x, y de los costos de material y mano de obra x 2 . Los datos se 
recabaron durante un periodo de 20 meses durante el cual la tasa de production y los 
costos del material y la mano de obra experimentaron una fluctuation muy amplia. La 
tasa de production se midiO como un porcentaje de la capacidad total de produc¬ 
tion, y se utilizO un indice apropiado para reflejar los costos del material y mano de 
obra. Las observaciones se encuentran en la tabla 14.11. Obtengase la mejor 
ecuaciOn de regresiOn para predecir el costo por unidad. 

Primero se supondra un modelo de regresidn lineal que solo tome en cuenta ax, 
y a x 2 . En la tabla 14.12 se proporcionan las estimaciones y otra information impor- 
tante. Hasta aqui parece que todo marcha muy bien. Las estimaciones tienen sentido 
(valor negativo para el coeficiente x, y positivo para el de x 2 ), las desviaciones estan- 
dar son pequeflas, el valor de R 2 es relativamente alto y todos los efectos son estadis- 
ticamente discernibles. Por lo tanto, se podria concluir que se ha obtenido una 
buena equation de prediction, pero una grafica de los residuos estandarizados contra 
x, revela un patron cuadratico en la mitad superior de la figura 14.3. Ningun patron 
es evidente para x 2 . 


TABLA 14.11 Datos de la muestra para el ejemplo 14.3 


Y 

x, 

x z 

13.59 

87 

80 

15.71 

78 

95 

15.97 

81 

106 

20.21 

65 

115 

24.64 

51 

128 

21.25 

62 

128 

18.94 

70 

115 

14.85 

91 

92 

15.18 

94 

93 

16.30 

100 

III 

15.93 

102 

116 

16.45 

82 

117 

19.02 

74 

127 

18.16 

85 

133 

18.57 

86 

135 

17.01 

90 

136 

18.03 

93 

140 

19.22 

81 

142 

21.12 

72 

148 

23.32 

60 

150 
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TABLA 14.12 AnMisis de regresi 6 n para el ejemplo 14.3 


Regresion de Y sobre x, y x 2 


Variable 

Coeficiente 
de regresidn estimado 

Desviacidn 
estandar estimada 

Valor t 

Constante 

20.2800 

\ 2.1300 

9.54 

X| 

-0.1377 

0.0159 

-8.69 

x 2 

0.0742 

0.0110 

6.77 


R 2 = 0.914 


^0.975, 17 = 2.1 1 




ANOVA 



Fuente 

gl 

SC 

CM 

Valor F 

Regresi 6 n 

2 

144.39 

72.19 

90.24 

•*1 

1 

107.72 

107.72 

i 34.65 

x 2 | X, 

1 

36.67 

36.67 

45.84 

Error 

17 

13.59 

0.80 


Total 

19 

157.98 

/o. 95 , 2,17 = 3.59;/ 0.95 

1. .7 = 4.45 


La grafica de los residuos para x, implica que debe incluirse un termino cuadrati- 
co en x, en el modelo de regresion. De esta forma, se ajustara el modelo 

Y — (3 0 + /3|X| + /33X3 + + e 

obteniendose los resultados que se muestran en la tabla 14.13. 

Una comparacion con los resultados anteriores revela que la inclusion de un efec- 
to cuadratico en x, mejora en forma considerable la ecuacion de regresion estimada. 
Por ejemplo, los coeficientes de regresion, tanto de x, como de x 2 , se estiman con una 
mejor precision comparada con la anterior y el valor de R z se incrementa hasta 
0.981. Ademas, la nueva grafica de residuos contra x, (vease la Fig. 14.4) no muestra 
ningun patron apreciable. 

Ejemplo 14.4 Recuerdese el ejemplo de los salarios iniciales contra la calificacion 
promedio, empleado a traves de todo el capitulo 13. Quiza el lector se pregunte si 
existiesen otras variables de prediccion potenciales. Supongase que tambien se ha 
observado la edad de cada estudiante en la muestra. Ya que algunas compaflias 
tienen como requisito poseer alguna experiencia en el campo y un recien egresado de 
mayor edad podria tenerla, es posible que la edad de este pueda influenciar en el sa- 
lario inicial que percibira. Los datos, tomando en cuenta la edad, se encuentranen la 
tabla 14.14. 

Cuando se hace una grafica de los residuos estandarizados de la ecuacibn de re¬ 
gresion estimada y = -6.63 + 8 .12x, contra los correspondientes valores de x 2 
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TABLA 14.13 Analisis de regresion revisado para el ejemplo 14.3 s 1 , 1 . v ' - U s 

Regresion de Y sobre x, y x 2 y x] 


Variable 

Coeficiente 
de regresion estimado 

Desviacidn 
estandar estimada 

Valor t 

Constante 

41.550000 


3.050000 

13.64 

x, 

-0.700300 


0.076200 

-9.20 

X2 

0.073400 


0.005400 

13.68 

X1 

0.003624 


0.000488 

7.43 


R 2 = 0.981 


4*75. 16 = 2.12 




ANOVA 



Fuente 

gl 

SC 

CM 

Valor F 

Regresion 

3 

154.92 

51.640 

270.37 

X 1 

1 

107.72 

107.72 

563.98 

x 2 I X, 

1 

36.66 

36.66 

191.94 

x] | X|, Xi 

1 

10.54 

10.54 

55.18 

Error 

16 

3.06 

0.191 


Total 

19 

157.98 

fa. 95. 3. 16 = 3.24; _/o.95, 1 

, ,6 = 4.49 


(vease la Fig. 14.5), se observa una tendencia lineal ascendente. Por lo tanto, se inclu- 
ye el efecto lineal de x 2 en el modelo de regresion y se ajusta 

Y = ft o + ft\*\ + fti* 2 + e. 

En la tabla 14.15 se muestran los nuevos resultados. Dado que ahora se estiman 
con mejor precision el termino constante, el coeficiente de x, y el valor de R 2 ha 
aumentado en forma apreciable, la inclusion de x 2 da como resultado una mejor 
ecuacion de prediccion. 


14.7 Regresion polinomial 

En la seccion 14.2 se menciono que el modelo polinomial dado por (14.3), o alguno 
que contenga terminos de interaccion como (14.4), es un caso especial del modelo li¬ 
neal general. De hecho, en el ejemplo 14.3 se mostro como el efecto cuadr&tico de 
una variable de prediccion puede mejorar la capacidad predictiva de la ecuacion 
de regresion. En esta seccion se ahondark m&s sobre este tipo de modelos. 

Si se ha identificado solo una variable de prediccion x y la grafica de las respues- 
tas observadas contra los valores de x revela una curvatura, entonces debe usarse un 
polinomio en x, de cierto grado, para aproximar la verdadera curva de regresion. 
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FIGURA 14.3 Graficas de los residuos estandarizados para el ejemplo 14.3 
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FIGURA 14.4 Graficas de los residuos estandarizados para la ecuacion de regresion revisada 
en el ejemplo 14.3 
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: TABLA 14.14 Datos aumentados para el ejemplo de los 
salaries iniciales 


Y 

xi( CP) 


; *2 Edad 

18.5 

2.95 


22 

20.0 

3.20 

\ 

23 

21.1 

3.40 

23 

22.4 

3.60 


23 

21.2 

3.20 


27 

15.0 

2.85 


22 

18.0 

3.10 


25 

18.8 

2.85 


28 

15.7 

3.05 


23 

14.4 

2.70 


22 

15.5 

2.75 


28 

17.2 

3.10 


22 

19.0 

3.15 


26 

17.2 

2.95 


23 

16.8 

2.75 


26 


2.0 + 


* 


o 

T3 

CS 

'C 

03 

*o 

a 

a 


o 

3 

T3 


04 


1 . 0 + * 


0.0 + 


* 

* 

* 

* 


- * 
-1.0+ >Je 
- * 


* 


* 


* 


* 


* 


- 2.0 + 

+ - ■ 
22.0 


X2 


23.5 


25.0 


26.5 


28.0 


29.5 


FIGURA 14.5 Residuos estandarizados contra la edad para el ejemplo 14.4 
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TABLA 14.15 Analisis.de regresidn para cl ejemplo 14.4:1 1 



_ Coeficiente 


_ Desviacion 


Variable 

v de regresidn estimado • > 

estandar estimada 

Valor t 

Constante 

-16.880 


5.470 

-3.05 

x, 

> 8.740 


1.220 

7.16 

X 2 

0.338 


0.137 

2.47 


R 2 = 0.813 

ANOVA 

4.975. 12 = 2.179 


Fuente 

gl 

SC 

CM 

Valor F 

Regresion 

2 

66.10 

33.05 

26.23 

Jt| 

1 

58.40 

58.40 

46.35 

X 2 | X, 

1 

7.70 

7.70 

6.11 

Error 

12 

15.17 

1.26 


Total 

14 

81.27 

/o.95, 2 . = 3.89; /o 95 

,.,2 = 4.75 


Por ejemplo, un modelo cubico en x esta dado por 

y, = Po + P,x,- + /3 u xf + flmXi + E,-, 

donde /3, recibe el nombre de coeficiente lineal, p [t es el coeficiente cuadratico y 
/3|,i es el coeficiente cubico. Para mantener la costumbre se ha alterado en forma li- 
gera la notacion para estos coeficientes de regresion para reflejar el patron de la co- 
rrespondiente potencia de x. 

Como se menciono con anterioridad, lo que se busca con un polinomio es el gra- 
do que mejor ajuste los datos dados. De acuerdo con lo anterior, el interes recae en 
probar hipotesis, como por ejemplo, H 0 \ p u = 0 o H 0 : /3 m = 0. Mediante el 
empleo de este enfoque se tiene la capacidad para determinar el polinomio mas apro- 
piado para estimar la respuesta promedio. Sin embargo, se advierte al lector que lo 
que se busca y se prefiere en forma general es un polinomio de un orden relativamen- 
te bajo. Se debera evitar el empleo de potencias muy grandes de la variable de pre¬ 
diction, debido a que lo que ocurre la mayor parte de las veces es un ajuste que expli¬ 
ca incluso las variaciones aleatorias que se encuentran en los datos; en otras 
palabras, siempre se puede encontrar un modelo polinomial de un grado, lo suficien- 
temente alto para ajustar los datos de manera perfecta, ya que un polinomio de gra¬ 
do n - 1 pasara a traves de todos los n valores de la respuesta. 

Muchas veces un modelo completo de segundo orden que contiene terminos li- 
neales, cuadraticos y de interaccibn, proporciona una aproximacion funcional exce- 
lente en comparacion con una funcion de respuesta desconocida y, en forma gene¬ 
ral, compleja. Por ejemplo, un modelo de segundo orden en dos variables es 

Yi = Po + P,Xj, + ft ,*,2 + p u x 2 n + (3 22 X 2 2 + [} n -<ilX ,2 + Bi, 
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donde /3, y /3 2 son los coeficientes lineales, (j u y flv. son los coeficfentescuadrSti- 
cos y /3, 2 es el coeficiente de interaccibn. Para este modelo, la matriz X y el vector de 
par&metros que figuran en la ecuacibn matricial ‘ 0 '“ 

Y = X/J + e 


son 



-1 

•*11 

x n 

r 2 

*li 

*12 

* 11 * 12 * 


*/3o“ 

X = 

1 

•*21 

X 22 

•*21 

*22 

* 21*22 


0 , 


.1 

X„i 

X n2 

x 2 „ | 

* n 2 

X„lX n2 - 


1 

r3 

1 _ 


Con los dos siguientes ejemplos se ilustrar&n tanto un modelo polindmico en u"a 
variable, asi como un modelo completo de segundo orden. 

Ejemplo 14.5 La demanda de cierto producto cambib debido a una variacibn r&pi- 
da de su precio por unidad. Supbngase que la demanda Y del producto se observa en 
una regibn geografica en particular sobre un intervalo bastante amplio de precios x. 
Dados los datos que se encuentran en la tabla 14.16, determinese el grado de un poli- 
nomio que mejor ajuste estos datos. 

Dado que solo se tiene una variable de prediccion, lo primero que se tiene que 
hacer es una grafica de la demanda contra el precio por unidad. La figura 14.6 revela 
una curvatura, lo cual indica que debe intentarse el ajuste con un modelo cuadratico. 

Para ilustrar cbmo se detecta la curvatura, supongase que se propone un modelo 
lineal sencillo. En la figura 14.7 se muestra un listado de computadora generado por 
Minitab y los residuos estandarizados resultantes contra el precio en la figura 14.8. 
La necesidad de incluir un efecto cuadratico en x es evidente. 


TABLA 14.16 Datos de la muestra para el ejemplo 14.5 


Y unidades 

a dolares 

360 

8.8 

305 

9.7 

230 

9.9 

242 

10.3 

180 

11.0 

172 

12.5 

121 

13.2 

83 

14.8 

122 

15.8 

91 

17.4 

105 

18.2 
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y 

420 + 


- * 
350 + 


* 


280 + 


210 + 


140 + 


70 h 


* 

* 






* * 


* 



8.5 11.0 13.5 16.0 18.5 


--+ x 
21.0 


FIGURA 14.6 Gr&fica de la demanda contra el precio por unidad para el ejemplo 14.5 


LA ECUACION DE REGRESION E8 
Y = 497. - 24.4 XI 





DEV. EST. 

COEFICEENTE-T 

COLUMNA 

COEFICIENTE 

DEL COEF. 

= COEF/D.E. 

— 


497.15 

60.85 

8. 17 

XI C2 


-24.419 

4.594 

-5.32 

LA DEV. EST. 

DE Y CON RESPECTO A LA RECTA DE 

REGRESION ES 


S = 47.53 





CON ( 11 

- 2 ) = 9 GRADOS DE LIBERTAD 



R-CUADRADA 

= 75.8 POR CIENTO 



ANALISIS DE 

VARIANZA 




DEBIDO A 

GL 

SC 

CM = SC/GL 


REGRESION 

1 

63815 

63815 


RESIDUO 

9 

20330 

2259 


TOTAL 

10 

84145 




FIGURA 14.7 Listado de computadora para el ejemplo 14.5 
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2.40+ ; 

- * 
1.60 + 


o 

| 

N 

a 

•o 


o 

'3 

*53 

OC 


0.80 + 


0.0 + 



* 


-0.80 + 


# 



* 


# 


* 


* 


* * * 


+---+-+-+-+-+ x 
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FIGURA 14.8 Residuos estandarizados contra el precio por unidad para el modelo lineal del 
ejemplo 14.5 


El listado de salida para un modelo cuadratico se muestra en la figura 14.9. 
Como se esperaba, existe una considerable mejoria en la prediction proporcionada 
por la eeuacibn de regresion estimada, que la que se tenia con un modelo lineal 
simple. Notese que Minitab tambien proporciona la “SC tipo /“, es decir, a traves 
de las entradas identificadas por “C2” y “ C3 " se tiene que SCR(x) = 63 814.5 y 
SCR(.v 2 | x) = 14 961.4, respectivamente. 

Aunque no se proporciona una grafica de los residuos estandarizados contra el 
precio para el modelo cuadratico, no mostrara ningun patron evidente; ademas, no se 
obtiene ninguna mejoria apreciable si se anaden al modelo terminos de orden supe¬ 
rior. Una ecuacion de regresion estimada de orden cuadratico es lo mas adecuado 
para predecir la demanda de este producto como una funcion del precio por unidad. 

Ejemplo 14.6 En el ejemplo 14.2 se considero la regresion lineal de la temperatura 
aparente Y sobre la temperatura del airex, y la humanidad relativax 2 para un inter- 
valo limitado de x, y x r Para el conjunto aumentado de datos dado en la tabla 14.17 
se desea ajustar y analizar una ecuacion de regresion completa de segundo orden. 
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LA ECUACION DE REGRESION ES 




Y = 1330. 

- 155. XI 

+ 4.87 X2 


DEV. EST. 

COCIENTE-T 

COLUMNA 

COEFICIENTE 


DEL COEF. 

= COEF/D.E. 

— 

( 

1330.4 


179.6 

7.41 

XI ' C2 


-155.47 


27.87 

-5.58 

X2 C3 


4.866 


1.031 

4.72 

LA DEV. EST. 

DE Y CON RESPECTO A LA RECTA DE REGRESION ES 


S = 25.91 






CON ( 11 

- 3) = 8 GRADOS DE LIBERTAD 




R-CUADRADA 

-93.6 POR CIENTO 




ANA LISTS DE 

VARIANZA 





DEBIDO A 

GL 

SC CM = 

SC/GL 


REGRESION 

2 

78775.8 

39387.9 


RESIDUO 

8 

5368.8 


671.1 


TOTAL 

10 

84144.7 




ANALISIS DE 

VARIANZA ADICIONAL 




SC EXPLICADA POR CADA VARIABLE QUE ENTRE EN EL ORDEN DADO 


DEBIDO A 

GL 

SC 




, REGRESION 

2 

78775.8 




C2 

1 

63814.5 




C3 

1 

14961.4 




FIGURA 14.9 Listado revisado para el ejemplo 14.5 




TABLA 14.17 Datos de la muestra para el ejemplo 14.6 




\*i 
*2 \ 

70° 

75 80 

85 

90 

95 

0% 

64 

69 73 

78 

83 

87 

10 

65 

70 75 

80 

85 

90 

20 

66 

72 77 

82 

87 

93 

30 

67 

73 78 

84 

90 

96 

40 

68 

74 79 

86 

93 

101 

50 

69 

75 81 

88 

% 

107 

60 

70 

76 82 

90 

100 

114 

70 

70 

77 85 

93 

106 

124 

80 

71 

78 86 

97 

113 

136 
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Con base en la experiencia cotidiana de cualquier persona con respecfo al'clima, 
debe ser evidente que la temperatura del airey la humedad relativa tienenuna inte- 
racciOn con la temperatura aparentei Por ejemplo; el calor que se siehte , cuando la 
temperatura del airees de ^“ylshumedad relativa es dellO%,esmuy’diferente a 
la que se percibe cuarido la humedad-relativa es del 70%. LosTesultadds'que se 
muestran en la tabla 14.18 son los quese obtienen cuando se supone un modelo com¬ 
plete) de segundo orden. , . . \ - f,L, 

El efecto de cada ttimino en el modelo sobre la temperatura aparente es estacKstica- 
mente discernible; los coeficientes de regresiOn se encuentran estimados con una exacti- 
tud razonablemente buena y el valor de R 2 es muy alto. De esta forma, la ecuaciOn 
de regresiOn estimada completa de segundo orden es adecuada para la prediction. 


14.8 Minimos cuadrados con factores de peso 

Una suposiciOn clave en la estimation por minimos cuadrados es que la varianza de 
cada error aleatorio es la misma. De la secciOn 14.6 recuerdese que si los residuos es- 


TABLA 14.18 Analisis de regresion para el ejemplo 14.6 

RegresiOn de Y sobre x,, x lt x], xl, y JC|jc 2 


Coeflciente 

Variable de regresion estimado 

Desviacion 
estandar estimada 

Valor t 

Constante 

175.3300 


36.11000 

4.86 


- 3.1689 


0.87580 

- 3.62 

Xl 

- 1.4351 


0.13210 

- 10.87 

7 

X\ 

0.0236 


0.00530 

4.46 

r 2 

X 2 

0.0017 


0.00056 


x t x 2 

0.0188 


0.00150 

12.56 

R 1 

= 0.977 


fo.975. 48 = 2.01 




ANOVA 



Fuente 

gl 

SC 

CM 

Valor F 

Regresion 

5 

11 , 966.71 

2393.34 

407.20 

Efecto lineal de x. 

1 

8536.13 

8536.13 

1452.32 

Efecto lineal de .v. 

1 

2330.71 

2330.71 

3%.54 

X] I X,, x 2 

1 

116.68 

116.68 

19.85 

x\ \ x u x 2 , x T 

1 

55.41 

55.41 

9.43 

Interaccion de x ,, x 2 

1 

927.78 

927.78 

157.85 

Error 

48 

282.12 

5.88 


Total 

53 

12 , 248.83 

f> 95 . s . = 2 . 42 ; ft 

.,.48 = 4.04 
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tandarizados tienden a, disminuir o a auraentar conforme se incrementan los valores 
estimados de la respuesta, la varianza del error no puede considerarse corao constante. 
El remedio apropiadopara esta situacibn es apljcar mlnimos cuadrados con fadores 
de peso, en los cuales las estimaciones para los coeficientes de regresi6n se obtienen 
mediante la minimizacibn de la suma con pesos de los cuadrados de los errores. Si se 
empleara la estimacibn po,r mlnimos cuadrados ordinarios en una situacibn para la 
cual la varianza del error no es constante, los coeficientes de regresibn no serian esti¬ 
mados con la misma precisibn. 

Antes de resolver algunos ejemplos, se examinar&n en forma breve los aspectos 
tebricos clave de la estimacibn por minimos cuadrados con factores de peso. A1 igual 
que en los minimos cuadrados ordinarios se supone que para el modelo lineal gene¬ 
ral 


Y = \p+ e, 

e es un vector de errores aleatorios no observable, tal que 

E(e) = 0, 

y la matriz de varianza-covarianza esta dada por 

E(ee') = Q. 

La matriz Q es de tal naturaleza que el elemento que se encuentra sobre la diagonal 
q„ es la varianza de e,, y < 7,7 es la covarianza entre e, y e, para toda i =f= j. Q debe 
ser no singular; de hecho, Q " 1 recibe el nombre de matriz de ponderacibn y la debe 
especificar el investigador, es decir, los pesos se asignan a cada observacibn de la res¬ 
puesta de acuerdo con alguna informacion respecto a la correspondiente varianza 
del error. Existen algunos procedimientos disponibles para los usuarios para deter- 
minar los pesos; lo anterior se ilustrara mas adelante. 

Las estimaciones de los coeficientes de regresibn se obtienen mediante la minimi- 
zacion de la suma con pesos de los cuadrados de los errores dada por 

e'Q 'e = (Y - X/?)'Q'(Y - X/3). 

Puede demostrarse que las ecu&ciones normales en forma matricial son 


X'Q ‘XB = X'Q Y. 


Si existe la matriz inversa (X'Q 'X) los estimadores por minimos cuadrados con 
factores de peso se obtienen mediante 

B= (X'Q X) X'Q Y. (14.31) 

Es importante notar que los minimos cuadrados ordinarios son un caso especial de 
los minimos cuadrados con factores de peso, es decir, siQ = cr 2 I, entonces es relati- 
vamente facil demostrar que (14.31) se reduce a la expresion usual 


B = (X'X) 'X'Y. 

www. FreeLibros. com 



14.8 Mlnimos cuadrados con fact ores de peso 549 

La definiri6n de la matriz Q implica una estructura de covarianza entre los erro- 
res aleatorios. En la pr&ctica, esta estructura resulta dificil de identificar. La aplica- 
ci6n m^s sencilla de la estimaci6n por mlnimos cuadrados con factores de peso es la 
de suponer que Q es una matriz diagonal de la forma 


Q = 


donde a 2 es la varianza de e/. Entonces 


"c^ 


cri 


(T„ 


Q 1 



0 



Por lo tanto, los errores aleatorios se suponen independientes, pero algunas de sus 
varianzas (si no es que todas) pueden ser diferentes. 

A continuation se examinaran algunas situaciones para las cuales es probable 
que se viole la suposicion de que la varianza del error es constante si se emplean mi- 
nimos cuadrados ordinarios. Una practica muy frecuente en la adquisicion de 
datos experimentales es tomar varias mediciones de la respuesta para cada uno de los 
puntos de observacion y despues calcular el promedio de las mediciones para cada 
uno. La principal razon para llevar a cabo este procedimiento es estabilizar la varia- 
bilidad de las observaciones individuales. Bajo este procedimiento la respuesta se 
convierte en un promedio. Dado que la desviacion estandar de un promedio es pro- 
porcional a la raiz cuadrada del tamaflo de la muestra sobre la cual se basa este pro¬ 
medio, la variation de Y it y de esta forma de e, , es o*/n it donde a 2 es la varianza 
comun del error y n, es el tamano de la muestra en relation con Y t . Esto conduce a 
un procedimiento de estimation por minimos cuadrados con factores de peso para el 
cual la inversa de la matriz Q esta dada por 


Q 1 


l 


cr 





Los pesos son los tamafios individuales de cada muestra n 2 , ..., n„ para los n 
puntos de observacion. La logica que se encuentra detras de lo anterior es muy senci- 
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11 a; los promedio basados en un gran numero de observations deben tener un ma¬ 
yor peso en la determinacidn de las estimaciones que aquellas que se basan en pocas 
observaciones. . -n * ;•>> r. 



Ejemplo 14 .7 Una compaftia implanta un programa de inspeccidn en el cual las uni¬ 
dades de ciertoproducto se revisan en forma visual en la linea de produccibn, con el 
objetivo de detectar las que se encuentran defectuosas. El gerente sabe que la velo- 
cidad de la linea afectara el numero de unidades defectuosas encontradas. Se se- 
lecciona un lote de unidades de un tamaflo suficiente y se envia a un departamento 
que se encargara de revisar el 100% de los mismos minuciosamente con el propdsito 
de encontrar el numero total de unidades defectuosas. Entonces el lote se coloca 
sobre la linea un numero variable de veces para cada una de las ocho velocidades que 
posee la misma. Para cada velocidad de la linea x se calcula el numero promedio Y 
de unidades defectuosas que no se descubrieron. Los datos que aparecen en la tabla 
14.19 son los resultados de este experimento y la ultima columna representa los ta- 
maflos individuales de cada muestra. Obtenganse y comparense las regiesiones 
simples de T sobre x, con base en minimos cuadrados ordinarios y con factores de 
peso. 

Para minimos cuadrados ordinarios se descartan los tamafios variables de cada 
muestra y se procede de la manera usual. Los resultados se muestran en la tabla 
14.20. Para minimos cuadrados con factores de peso se ilustrara el calculo de las es¬ 
timaciones. Dado que los pesos son los tamafios de cada una de las muestras. 


14 


Q-' 


3 


0 


0 


2 


TABLA 14.19 Datos de la muestra para el ejemplo 14.7 


Y 

x(pie/min) 

n 

0.50 

10 

14 

4.67 

20 

3 

6.25 

30 

25 

10.00 

40 

2 

13.50 

50 

3 

13.70 

60 

22 

17.50 

70 

5 

23.00 

80 

2 
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TABLA 14.20 Estimations por minimos cuadrados ordinarios y tabla ANOVA para el 
ejemplo 14.7 & 


Variable 

.. Coeficiente 

de regresidri estimado 

Desviacion 
estandar estimada 

Valor t 

Constahte 

-2.1190 


0.9490 

ESI 

X 

0.2946 

\ 

0.0188 

mm 


r 1 = 0.976 


to.975. 6 = 2.447 


■ 


ANOVA 



Fuente 

gl 

SC 

CM 

Valor F 

Regresidn 

V 1 

364.62 

364.62 

246.36 

Error 

6 

8.89 

1.48 


Total 

7 

373.51 

fo 95. 1. 6 = 5.99 



y 


X'Q 'X 


1 1 
10 20 


1 

80 


14 


"l 10~ 

3 


1 20 

2 


J 80_ 


CT 


76 

3010 


3010" 
152 300. 


Ademas, 


(X'Q” 'X)” 1 


0.06056388 - 0.00119696" 

-0.00119696 0.00003022. 


Entonces, mediante el empleo de (14.31), las estimaciones de minimos cuadrados 
con factores de peso son 


V 


0.06056388 

-0.00119696" 

f 1 1 - n 

-b\- 

= <T 2 

.-0.00119696 

0.00003022. 

- 1 

o 

00 

o 

n 

o 

_i 


www. FreeLibros. com 







552 Andlisis de regresidn: el modelo lineal general 



Los resultados del an&lisis de regresidn con factores de peso se dan en la tabla 14.21. 

Una comparacidn de los resultados basados en minimos cuadrados con factores 
de peso y ordinarios muestran una ligera mejoria en la precision de las estimacio- 
nes de minimos cuadrados con factores de peso, as! como un pequeflo aumento en el va- 
ior de r 2 . Debe notarse que si los tamaflos de cada muestra individual no difieren 
mucho entre si, es muy probable que los resultados que se obtengan mediante el 
empleo de los dos metodos sean muy similar es. 

En el ejemplo 14.7 se supuso de antemano una varianza del error no constante, 
debido a que el registro de las observaciones de la respuesta son promedios basados 
en tamaflos variables de las muestras. Sin embargo, la mayoria de las veces la falta 
de una varianza constante para el error debe determinarse en forma empirica. Ya se 
ha indicado que una grafica de los residuos estandarizados contra las respuestas esti- 
madas resulta ser una ayuda considerable en la detection de la heterocedasticidad, 
pero para aquellos problemas para los cuales se tienen disponibles observaciones re- 
petidas de la respuesta para el mismo punto de observation, es preferible registrar las 
observaciones reales mas que sus promedios y emplearlas para detectar una varianza 


TABLA 14.21 Estimaciones por minimos cuadrados con factores de peso y tabla ANOVA 
para el ejemplo 14.7 


Variable 

Coeficiente 
de regresidn estimado 


Desviacion 
estandar estimada 

Valor t 

Constante 

-2.0540 


0.6990 

-2.94 

X 

0.2753 


0.0156 

17.63 


r 2 = 0.981 


to.975. 6 = 

2.447 


ANOVA 



Fuente 

gl 

SC 

CM 

Valor F 

Regresion 

1 

2508.66 

2508.66 

310.86 

Error 

6 

48.43 

8.07 


Total 

7 

2557.09* 

/o.95. 

,6 = 5.99 


* Las sumas de los cuadrados son diferentes de las anteriores debido a que ahora son funciones de los pe¬ 
sos impuestos. 
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no constante del error. Para estos tipos de problemas la gr&fica de las observaciones 
contra los valores de la variable de prediccidn revelari una varianza no constante, si 
es que feta existe. El siguiente ejemplo ilustra este problema. 

Ejemplo 14.8 Recientemente, la variabilidad del ozono en la estratbsfera ha redbi- 
do gran atencion, especialmente en el impacto que el hombre tiene sobre el clima. El 
ozono es una forma de oxigeno que se encuentra en diversas cantidades en la estra- 
tosfera y constituye un componente muy importante de la atmosfera, ya que tiene 
la propiedad de bloquear la radiacibn ultravioleta que provienen del sol. Los datos 
que se encuentran en la tabla 14.22 muestran la cantidad de ozono registrada Yy su 
presion parcial x para cada capa de altitud, donde cada capa tiene aproximadamente 
un kilometro de altura. Por conveniencia, las capas se han escalado a un intervalo de 
-7 a +7. Determinese si la varianza del error puede considerarse como constante. 


TABLA 14.22 Datos de la muestra para el ejemplo 14.8 


Capa 

Ozono 

Capa 

Ozono 

-7.00 

53.8 

- 1.00 

102.8 

-7.00 

53.3 

- 1.00 

96.9 

-7.00 

54.8 

-1.00 

98.2 

-7.00 

54.6 

0.0 

98.9 

-7.00 

53.7 

0.0 

96.1 

-7.00 

55.2 

0.0 

99.6 

-7.00 

55.7 

0.0 

91.4 

-7.00 

54.1 

1.00 

101.1 

-6.00 

63.8 

1.00 

94.6 

-6.00 

64.2 

1.00 

95.9 

-6.00 

66.9 

2.00 

92.3 

-6.00 

67.2 

2.00 

96.6 

-6.00 

65.4 

2.00 

98.5 

-6.00 

67.3 

3.00 

93.6 

-5.00 

71.8 

3.00 

86.2 

-5.00 

73.2 

3.00 

87.9 

-5.00 

75.6 

3.00 

89.5 

-5.00 

76.2 

4.00 

74.8 

-5.00 

72.7 

4.00 

82.3 

-4.00 

79.4 

4.00 

76.9 

-4.00 

81.1 

4.00 

81.2 

-4.00 

85.2 

5.00 

73.6 

-4.00 

83.0 

5.00 

65.4 

-4.00 

84.1 

5.00 

67.1 

-4.00 

82.8 

6.00 

60.2 

-3.00 

90.3 

6.00 

54.9 

-3.00 

84.2 

6.00 

50.8 

-3.00 

88.3 

7.00 

44.7 

-3.00 

86.0 

7.00 

38.5 

-2.00 

93.2 



-2.00 

97.4 



-2.00 

98.3 
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FIGURA 14.10 Grafica del ozono contra la altitud de la capa para el ejemplo 14.8 


Una grafica de la cantidad de ozono contra la capa, figura 14.10, revela que la 
varianza del error no puede considerarse como constante debido a que la variabili- 
dad en la cantidad de ozono aumenta conforme la capa crece. La figura 14.10 tam- 
bien sugiere que el modelo apropiado por utilizar es una ecuacion cuadratica. 

En una situation como esta, en la que existen repeticiones para varios puntos de 
observacion, los pesos se determinan mediante el calculo de la varianza de las medi- 
ciones de la respuesta para cada punto de observacion. De esta forma, cada peso es 
el redproco de la correspondiente varianza. Por ejemplo, si y, 7 denota la i-esima me- 
dicion de ozono en la y-esima capa, la varianza de la muestra de la y-esima capa es 

sj = X ( y>j ~ - i). 

j= i 

y el correspondiente peso es Wj = 1 /s 2 j. Como ilustracion, considerense las observa¬ 
tions para X = 0. Estas son 98.9, 99.6 y 91.4. Entonces, n 7 = 4, y.j = 96.5, s] = 
13.8467. y = 1/13.8467 = 0.0722. A1 seguir este procedimiento, los pesos 
correspondientes para cada capa son los que se muestran en la tabla 14.23. 
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TABLA 14.23 Pesos para el ejemplo 14.8 


Capa 

Peso 


Capa 

Peso 

-7 

1.4956 


1 J 

' " ' 0.0845 

-6 

0.4119 


2 

f 0.0991 

-5 \ 

0.2755 


3 

0.0997 

-4 

0.2304 


4 

0.0797 

-3 

0.1411 


5 

0.0534 

-2 

0.1349 


6 

0.0450 

-1 

0.1041 


7 

0.0520 

0 

0.0722 





Mediante el uso de estos pesos y al ajustar un modelo cuadratico, se obtienen, 
para el czono, los resultados que se encuentran en la tabla 14.24. Es evidente que 
una ecuacion cuadratica de regresion basada en minimos cuadrados con factores de 
peso es muy adecuada para describir la variabilidad de la cantidad promedio de ozo- 
no como una funcion de la altitud. 

La mayoria de las veces no existen observaciones repetidas, pero los datos se re- 
caban en agrupaciones naturales las que pueden, a priori, sugerir varianzas diferen- 
tes para el error en cada grupo. Lo que en general se hace es suponer que la varianza 
dely'-6simo grupo es cjcr 2 , donde Cj es tinica para ely'-esimo grupo, pero a 2 es comun 
para todos los grupos. En general, los valores de las c. no son conocidos, pero pueden 
estimarse primero al determinar la varianza residual para cada grupo, sj basada en 


TABLA 14.24 Estimaciones por minimos cuadrados con factores de peso y tabla ANOVA 
para el ejemplo 14.8 


Coeficiente Desviacion 

Variable de regresion estimado estandar estimada Valor t 


Constante 

X 

x 1 

96.7590 

-0.5585 

-0.9495 


0.6367 

0.1266 

0.0238 

151.98 

-4.41 

-39.83 

R 2 = 

0.9817 


to.975. 58 

= 2.00 



ANOVA 



Fuente 

gl 

SC 

CM 

Valor F 

Regresion 

2 

4082.33 

2041.17 

1556.30 

Efecto lineal 

1 

2001.11 

2001.11 

1525.78 

Efecto cuadratico 

1 

2081.22 

2081.22 

1586.82 

Error 

58 

76.07 

1.31 


Total 

60 

4158.40 

f> 9S. 2. 58 = 

315;7o.95. i.58 = 4.00 
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los residuos de estos. Los residuos se obtienen mediante el ajuste de un modelo lineal 
general empleando minimos cuadrados ordinarios. Entonces, una estimacibn de c. es 
Sj/s, donde s es la desviacion estandar residual global basada en los minimos cuaora- 
dos ordinarios y Sj es la desviaci6n estandar residual para el y-esimo grupo. Entonces 
el peso para el y'-esimo grupo es Wj = \jc) = s 2 / sj. 


14.9 Variables indicadoras 


En casi todos los problemas que se han considerado hasta este momento, las va¬ 
riables de prediction han sido cuantitativas en el sentido en que toman valores de 
una escala numerica bien defmida. Sin embargo, para muchas variables como la lo- 
calizacibn geogr&fica, el estado civil, las poblationes urbanas o rurales o alguna otra, 
no es evidente tener una escala bien definida. Dado que estas variables cualitativas 
son factores import antes en muchas situaciones, a continuation se examinarft una 
manera de cuantificar los niveles de una variable de prediction cualitativa para su 
empleo en el analisis de regresion. Se consideraran las que comunmente se conocen 
como variables indicadores o mudas. A cada una de estas variables se le asignan los 
valores 0 y 1. 

Como ilustracion, considerese la tasa de crimenes para dos estados adyacentes, 
para los que los datos figuran en el ejercicio 14.16 que se encuentra al final de este 
capitulo. En particular, supongase que se desea hacer una regresion de la tasa de 
crimenes sobre el porcentaje de la poblacion urbana en un estado para aquellos que 
se encuentren solo en las regiones 1 y 5. El modelo de regresion sera una funtion de 
la variable cuantitativa r, (porcentaje de poblacibn urbana) y una variable de predic- 
ci6n cualitativa que representa las dos regiones de interes. 

Dado que solo se tienen dos regiones, es conveniente definir dos variables indica¬ 
doras x 2 y x 3 tales, que 



si un estado es encuentra en la regibn 1, 
de otro modo, 

si un estado se encuentra en la regibn 5, 
de otro modo. 


Entonces, para obtener una sola ecuacion de regresion para ambas regiones, se debe- 
ra ajustar el modelo 


Y = po + /V, + Pi x 2 + P 1*1 + e. 


Pero si se hace esto, entonces la matriz X'X no tendria inversa. Una manera facil de 
salir de este problema es eliminar una de las dos variables indicadoras y emplear so- 
lamente una, por ejemplo x 2 , en donde al igual que antes. 


X 2 = 


c 


si un estado se encuentra en la regibn 1, 
de otro modo, 
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En otra palabras, para cualquier estado que se encuentre en la regidn 1 (x 2 = 1) o si 
se encuentra en la region 5 (x 2 = 0). En general, si una variable cualitativa tiene m 
niveles, puede representarse por medio de m - 1 variables mdicadoras, asignando a 
cada una los valores de.O y 1. 

' - 'v.,:-; ■ A*:'. "V ■ ■ • * «‘ >-■' : ' •" 

Considerese de nuevo el problema de la tasa de crimenes para las regiones 1 y 5. 
Exist en varias maneras de abordar el desarrollo de un modelo de regresion. Se puede 
reunir la informaci6n proveniente de ambas regiones y entonces ajustar el modelo li¬ 
neal simple 

Y = /3„ + 01-r, + e, 

ignorando las diferencias regionales pueden obtenerse ecuaciones de regresion separa- 
das para las regiones, cada una con diferentes estimaciones para los coefidentes de re¬ 
gresion. La eleccion entre estas dos opciones debe hacerse con mucho cuidado. En rea¬ 
lidad debe deddirse si cada una de estas dos regiones es distinta con respecto a la tasa 
de crimenes, o si existe alguna relacidn en comun. Si lo primero es cierto y se ajusta el 
modelo dado con anterioridad, entonces es probable que la tasa de crimenes en una re¬ 
gion se encuentre sobreestimada mientras que para la otra ocurre lo contrario. Si exis¬ 
te una relation en comun, entonces no es necesario tener dos ecuaciones de regresion 
separadas. 

A1 comparar los resultados que se obtienen con base en las ecuaciones de regre¬ 
sion separadas y la unica para las regiones 1 y 5 mediante el empleo del porcentaje de 
poblacion urbana como la unica variable de prediccion, se obtienen los datos que se 
encuentran en la tabla 14.25. 

La comparacion revela que las estimaciones para cada una de las pendientes son, 
en esencia, las mismas, pero las estimaciones de las intersecciones son significativa- 
mente diferentes. Notese tambien que la ecuacion de regresion unica exhibe las pro- 
piedades menos deseables. De hecho, con esta ultima ecuacion las tasas para los es- 
tados que se encuentran en las region 1 se sobreestiman, mientras que para los esta- 
dos que se encuentran en la region 5 se subestiman con una sola excepcion. Por lo 
tanto, en forma aparente existen diferencias regionales para la respuesta y no deben 
ignorarse. 

Para incorporar las diferencias regionales dentro del modelo, solo se utilizara la 
variable indicadora x 2 definida con anterioridad; el modelo se convierte en 

Y = + /3,.v, + /?+ s. (14.32) 

Para interpretar los coefidentes de regresion, considerense los estados de la region 5. 
Dado que para estos x, = 0, se supone una curva de regresion dada por 


E(Y) = J3 0 + p t x„ 

que es la ecuacion de una linea recta con pendiente /3, e interseccion /3 0 . Para los esta¬ 
dos que se encuentran en la region 1, x 2 = 1, y la respuesta media toma la forma 

E(Y) = /3 () + | + /J 2 

= (Po + P2) + P\ x i » 
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TABLA 14.25 Modelos de regresidn combinado y separado para el ejemplo de la tasa de 


Modelo de regresidn estimado 



Coeficiente ’ 

Desviacidn 


Variable 

de regresidn estimado 

estandar estimado 

Valor t 

Constante 

7.0350 

4.2300 

1.66 

JC, 

-0.0094 

0.0673 

-0.14 

n = 12 

r 2 = 0.002 

to. 975 . io = 2.228 



Modelo de regresidn para la regidn 1 



Coeficiente 

Desviacidn 

Valor t 

Variable 

de regresidn estimado 

estandar estimada 

Constante 

0.4170 

0.8020 

0.52 

x, 

0.0404 

0.0118 

3.41 

n = 6 

r 2 = 0.745 

to. 975 , 4 = 2.776 



Modelo de regresidn para la regidn 5 



Coeficiente 

Desviacidn 


Variable 

de regresidn estimado 

estdndar estimada 

Valor t 

Constante 

7.4400 

3.9500 

1.88 

X\ 

0.0439 

0.0686 

0.64 

n = 6 

r 2 = 0.093 

to. 975 , 4 = 2.776 



la que tambien es la ecuacion de una linea recta con la misma pendiente, /3,, pero 
con una intersection diferente /3 0 + 0 r Entonces el modelo dado por (14.32) pro- 
porciona la respuesta promedio como una funcion lineal de x, con la misma pen¬ 
diente para ambas regiones, pero con diferentes intersecciones. El parametro /3 2 
representa el efecto diferencial que existe entre las intersecciones de las dos regiones. 
Para ajustar el modelo (14.32) el vector Y y la matriz X son 


4.2 


1 

77.6 

1 

2.4 


1 

50.8 

1 

3.1 


1 

84.6 

1 

3.2 


1 

56.4 

1 

3.9 


1 

87.1 

1 

1.4 

X = 

1 

32.2 

1 

10.2 


1 

80.5 

0 

11.7 


1 

60.3 

0 

10.6 


1 

45.0 

0 

11.9 


1 

47.6 

0 

9.0 


1 

63.1 

0 

6.0 


1 

39.0 

0 


Los resultados de la regresion se muestran en la tabla 14.26 
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TABLA 14.26 Analisis de regresion para el ejemplo de la tasa de crimenes 


Variable 

Coeficiente 
de regresion estimado 

Desviacion t Sf < ;i ->< 
estandar estimada 

Jp oh-.r . . 

i .r o Valor t 

Constante 

7.5800 

1.6400 

4.62 

x, x 

0.0416 

0.0269 

1.54 

Xi 

-7.2340 \ 

0.9520 

-7.60 

n = 12 

R 2 = 0.865 

^0.975, 9 = 2.262 



Con base en estos resultados, las diferencias regionales son estadisticamente sig- 
nificativas. De esta forma, la ultima ecuacion de regresion es superior con respecto 
al modelo unico en el cual no se consideraban las diferencias regionales. En particu¬ 
lar, las dos regiones tienen la misma estimacibn para la pendiente (0.04 i 6), pero las 
intersecciones son iguales a 7.58 para la region 5 y 7.58 - 7.23 = 0.35 para la regibn 1. 
En general puede suponerse que la pendiente es la misma y, por lo tanto, es mejor 
emplear un modelo con una variable indicadora que un modelo unico. Ademas, 
tambien es mejor un modelo con una variable indicadora que emplear dos modelos 
de regresibn separados debido a que para el primero se tiene un mayor numero de 
grados de libertad disponible para el error que para el segundo. De acuerdo con lo 
anterior, ft y ft son las estimaciones con la mejor precision como es el caso para este 
ejemplo. 

iQue ocurre si la pendiente no es la misma? Esta situation puede manejarse me- 
diante la introduction en el modelo de un termino de interaction para la variable 
cuantitativa x x y para la variable indicadora x 2 . El modelo propuesto se convierte en 

y = ft + + ftx 2 + ft 2 jr,.r 2 + e. (14.33) 

Para los estados que se encuentran en la region 5, jc 2 = 0. Entonces, jc,jc 2 = 0, y 
la respuesta promedio para esta region es 

£(E) = ft + ft*,. 


Para los estados que se encuentran en la region 1, x 2 = 1, y jc , jc 2 = x,, la respuesta 
media para esta region es 

E(Y) - ft + ftx, + ft + ft 2 X| 

- (ft + ft) + (ft + ft 2 )*i- 

Notese que el coeficiente de regresion de x 2 es el efecto diferencial que existe entre las 
intersecciones de las dos regiones y el coeficiente de regresion del producto cruzado 
x,x 2 es el efecto diferencial entre las pendientes de las dos regiones. Por lo tanto, su- 
poniendo que existe una interaccion estadisticamente apreciable entre x [ y x 2 , pueden 
obtenerse las ecuaciones estimadas de regresion para cada region mediante el empleo 
d$l modelo dado por (14.33). 

Para finalizar, se examinara el problema en el cual una variable cualitativa tiene 
mas de dos niveles. Este caso requiere del uso de mas de una variable indicadora en 
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el modelo de regresidn. Como ilustracion, se continuard con el problema de la tasa 
de crimenes al llevar a cabo una comparacion entre los estados de las regiones 1,5 y 
7. Dado que se han identificado tres niveles de una variable cualitativa, se definir&n 
dos variables indicadoras de la siguiente manera: ' " ' " . 



si un estado se encuentra en la regibn 1, 
de otro modo, 



si un estado se encuentra en la regibn 5, 
de otro modo. 


Este arreglo proporciona el mismo numero de combinaciones posible de los valores 
de x 2 y Xj de acuerdo con el numero de niveles de la variable cualitativa. Estos son 
x 2 = 1, Xj = 0; x 2 = 0, jc 3 = 1 ; y x 2 = x 3 = 0. Representan los estados en las 
regiones 1, 5 y 7 respectivamente. 

Si se supone que las pendientes son iguales para las tres regiones, el modelo es 

y = 0o + 0i*i + 0 2 x 2 + 0 3X3 + e. 

Para los estados que se encuentran en la region 7, x 2 = 0 y x 3 = 0, de tal manera 
que la respuesta se reduce a 

E(Y) = 0 O + 0i*i, 


que es la ecuacion de una linea recta con pendiente 0, e interseccibn 0 O . Para los esta¬ 
dos que se encuentran en la region 5, x 2 = 0 y x } = 1. De acuerdo con lo anterior, 
la curva de regresion es 


E(Y) = /3 0 + /3.JC, + /8j 
= (/8 0 + &) + /8,x,, 

donde /3, representa el cambio en la interseccion de la region 5 con respecto al de la 
region 7. De manera similar, cuando x 2 = 1 y x } - 0, la respuesta media es 

E(Y) = (3 0 + (3 ,x, + /3 2 
= (0n + 0 2 ) + * 

donde ahora 0 : es el cambio en la interseccibn de la region 1 con respecto al de la re¬ 
gion 7. Se deduce que tanto 0 : como 0 3 representan los efectos diferenciales para las 
intersecciones de las regiones 1 y 5, respectivamente, en relacibn con la interseccion 
de la region 7. 

El caso para el cual no es posible suponer que las pendientes son iguales, en este 
momento debe ser ya evidente, es decir, si se asume un modelo de la forma 

Y = 0 O + 0|.v, + 0,.v 2 + 0j.v 3 + ( 3 \ 2 x , x 2 + 0 13 jv,jc 3 + s, (14.34) 

donde 0, 2 y 0 ]3 son los coeficientes de regresion para las interacciones que 
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comprenden a la variable cuantitativa x, y a cada una de las dos variables indicado¬ 
ras x, y x r 

Ejemplo 14.9 Se seleccionan al azar cinco casas recientemente vendidas para tres 
distintas zonas residenciales (A, B y C) en cierta ciudad, y el precio de venta Y se 
compara con el valor catastral de la propiedad x, determinado por la oficina estatal 
local correspondiente. Los datos se encuentran eh la tabla 14.27 donde el precio de 
venta y el valor catastral de la propiedad se dan en miles de dolares. Mediante el 
empleo de variables indicadoras, ajustese una ecuacion de regresion lineal y 
determinese si las pendientes para las tres zonas residenciales son las mismas. 

Dado que se tienen tres zonas residenciales, se definen dos variables indicadoras 
x 2 y x 3 tales, que 



si una casa se encuentra en la zona B, 
de otro modo, 

si una casa se encuentra en la zona C, 
de otro modo. 


Para el modelo (14.34) el vector Yy la matriz X son iguales a 


42.5 


1 

33.1 

0 

0 

0 

0 

36.8 


1 

42.0 

0 

0 

0 

0 

42.6 


1 

47.8 

0 

0 

0 

0 

41.2 


1 

53.4 

0 

0 

0 

0 

48.6 


1 

59.6 

0 

0 

0 

0 

75.2 


1 

63.9 

1 

0 

63.9 

0 

83.4 


1 

68.4 

1 

0 

68.4 

0 

83.3 

X = 

1 

72.3 

1 

0 

72.3 

0 

116.8 


1 

77.8 

1 

0 

77.8 

0 

114.3 


1 

80.8 

1 

0 

80.8 

0 

122.8 


1 

96.5 

0 

1 

0 

96.5 

125.6 


I 

101.8 

0 

1 

0 

101.8 

132.5 



106.2 

0 

1 

0 

106.2 

127.4 



112.6 

0 

1 

0 

112.6 

147.8 


L . 1 

120.5 

0 

1 

0 

120.5 


TABLA 14.27 Datos de la muestra para el ejemplo 14.9 


Zona A 

.v Y 

Zona B 

v Y 

Zona C 

x Y 

33.1 

42.5 

63.9 

75.2 

96.5 

122.8 

42.0 

36.8 

68.4 

83.4 

101.8 

125.6 

47.8 

42.6 

72.3 

83.3 

106.2 

132.5 

53.4 ■ 

41.2 

77.8 

116.8 

112.6 

121.4 

59.6 

48.6 

80.8 

114.3 

120.5 

147.8 
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El Iistado de computadora que produce Minitab se encuentra en la figura 14.11, 
donde C2-C6 se refieren a x t , x 2 , x } , x,x 2 , y x t x 3 » respectivamente. 

Notese que la hipotesis nula 



puede rechazarse, pero la hipotesis 

H 0 : (3]j = 0 

no; por lo tanto, existe una raz6n para creer que las pendientes para las zonas resi- 
denciales A y B no son las mismas. Del Iistado se determina que las ecuaciones esti- 


LA ECUACION DE REGRESION E8 
Y= 31.4 + 0.232 X1 - 129.X2 


+ 

1.89 X3 

+ 2.41 X4+ 0.679 X5 






DEV. EST. 

COCIENTE-T 


COLUMNA 

COEFICIENTE 

DEL COEF. 

= COEF/D.E. 


— 

31.37 

14.66 

2.14 

XI 

C2 

0.2325 

0.3050 

0.76 

X2 

C3 

-128.81 

36.29 

-3.55 

X3 

C4 

1.89 

38.82 

0.05 

X4 

C5 

2.4112 

0.5481 

4.40 

X5 

C6 

0.6786 

0.4518 

1.50 


LA DEV. EST. DE Y CON RESFECTO A LA RECTA DE REGRESION ES 
S = 6.238 

CON ( 15 - 6) = 9 GRADOSDE LIBERT AD 

R-CtFADRADA =98.4 POR CIENTO 
ANALISIS DE VARIANZA IE 

DEBIDOA GL SC CM = SC/GL 


REGRESION N 

RESIDUO 

TOTAL 


5 21577.96 4315.59 
9 350.26 38.92 
14 21928.22 


ANALISIS DE VARIANZA ADICIONAL 

SC EXPLICADA POR CADA VARIABLE QUE ENTRA EN EL ORDEN DADO 


DEBIDO A 
REGRESION 
C2 
C3 
C4 
C5 
C6 


GL SC 

5 21577.96 

1 19892.61 

1 698.16 

1 232.89 

1 666.52 

1 87.79 


FIGURA 14.11 Listado de computadora para el ejemplo 14.9 
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madas de regresion para cada zona residencial son las siguientes: 

Zona A: 5? = 31.37 + 0.2325*,, 
(x 2 = x 3 = 0) X. 

Zona B: y = -97.44 + 2.6437*,, 
( x 2 = 1, * 3 = 0) ^ 

ZonaC: y = 33.26 + 0.9111*,. 

(* 2 = 0 , * 3 = 1 ) 


i i ! r- 
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Ejercicios 

14.1. De los siguientes modelos, icuales no son casos del modelo lineal general y por que? 

a) Y = 0 O + /3,exp(/3 2 *,) + 0 3 * 2 + e 

b) Y = /3,*| + 0 2 * 2 + 0 3 *5 + 04*5*2 + e 

c) Y = 0 O + 0,/*, + 0 2 *1 /2 + e 

14.2. Una agencia de alquiler de automoviles obtiene la siguiente ecuacion de regresion: 

y = 0.75 + 1 . 2 *, + 0 . 15* 2 

para predecir el costo promedio anual Y en miles de dolares como una funcion del nu- 
mero de automoviles alquilados * t y del numero promedio de millas que cada automo- 
vil recorre * 2 en miles de millas. Expliquese el signiflcado de cada uno de los coeficien- 
tes estimados de la regresion. 

14.3. Supongase que la ecuacion estimada de regresion que describe una respuesta media co¬ 
mo una funcion de dos variables de prediccion esta dada por 

y = 15 + 6 *| — 2* 2 — 1 . 5 * i * 2 . 

a) iCual es el efecto sobre la respuesta media por unidad de cambio en *, cuando x 2 = 
27 

b) iCual es el efecto sobre la respuesta media por unidad de cambio en * 2 cuando *, = 
1? 
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14.4. Mediante el empleo de los datos de Prater, ajustense todos los modelos lineaies que 
incluyan solo a x, y a x y e ilustrese el principio de la suma de cuadrados extra mediante 
el calculo de lo siguiente: 

> _ 

a) Las tablas de an&lisis de varianza correspondientes. 

b) SCR(x s \x,)y SCR(x, | x,). 

c) Las pruebas F parciales apropiadas. 

14.5. Una agenda desea estimar los gastos en alimentadon de una familia con base en el 
ingreso y su tamaflo. Los datos que se encuentran en la tabla 14.28 representan los gas¬ 
tos de alimentadon por mes Y en miles de dolares, contra el ingreso mensual x ( y el ta¬ 
maflo de la familia x para 15 familias que se seleccionaron al azar en cierta localidad 
geogratica. 


TABLA 14.28 Datos de la muestra 
para el ejercido 14.5 


Y 

x, 

Xi 

0.43 

2.1 

3 

0.31 

1.1 

4 

0.32 

0.9 

5 

0.46 

1.6 

4 

1.25 

6.2 

4 

0.44 

2.3 

3 

0.52 

1.8 

6 

0.29 

1.0 

5 

1.29 

8.9 

3 

0.35 

2.4 

2 

0.35 

1.2 

4 

0.78 

4.7 

3 

0.43 

3.5 

2 

0.47 

2.9 

3 

0.38 

1.4 

4 


a) Ajustense todos los modelos lineaies que abarcan a x y/o x.,, e interpretense los 
coeficientes de regresidn estimados. 

b) Pruebese la hipotesis nula H 0 : /3, = /3 2 = 0. 

c) Calculese SCR (x 2 1 X|) y SCR (x, J x 2 ) y llevense a cabo las pruebas F parciales 
apropiadas. 

d) Calculese e interpretese el coeficiente de correlacion multiple R~. 

e) Con base en los resultados anteriores, decidase cual es la mejor ecuacion para pre- 
decir el gasto de alimentadon y empleese para estimar el gasto promedio mensual en 
alimentadon para una familia de cuatro personas con un ingreso mensual de 
$2 500. Determinese un intervalo de confianza del 98% para esta cantidad. 

14.6. Con respecto al ejercicio 14.5 hagase lo siguiente: 

a) Para la regresion que comprende, tanto a x | como a x 2 , efectuense las pruebas indi¬ 
viduates t para los coeficientes de regresion /3, y fi 2 . Usese a = 0.05. 

b) Determinense intervalos de confianza de 95% para /3 t y ft y formulense las conclu- 
siones apropiadas. 
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14.7. Mediante el uso de los datos del ejercicio 14.5, construyase un modelo lineal general 
que abarque tanto a como a x 2 en forma matricial; identifiquense todas las matrices 
y obtenganse las ecuaciones norm ales. 

14.8. En muchas agendas gubernamentales y compaflias privadas el problema de identificar 
aquellos factores que son importantes para predecir la aptitud para el trabajo de los as- 
pirantes a obtener un ejemplo constituye un proceso continuo. El procedimiento usual 
es el de aplicar al solicitante un conjunto de pruebas apropiadas y tomar las dedsion de 
contratarlo o no con base en los resultados de estas. El asunto clave es conocer a priori 
que pruebas pueden predecir la aptitud para el trabajo de una persona. Supongase que 
el personal de una compaflia muy grande ha desarrollado cuatro pruebas para una 
determinada clasificacion con respecto al trabajo. Estas pruebas se aplicaron a 20 indi- 
viduos que fueron contratados por la compaflia. Despues de un periodo de dos aflos, 
cada uno de estos empleados se clasifica de acuerdo con su aptitud para el trabajo. La 
puntuadon para la aptitud hacia el trabajo Y y la correspondiente a cada una de las 
cuatro pruebas jr„ x 2 , x } , x x se dan en la tabla 14.29. 


TABLA 14.29 Datos de la muestra para el ejercicio 14.8 


Empleado 

Y 

x, 

Xl 

x, 

*4 

1 

94 

122 

121 

96 

89 

2 

71 

108 

115 

98 

78 

3 

82 

120 

115 

95 

90 

4 

76 

118 

117 

93 

95 

5 

111 

113 

102 

109 

109 

6 

64 

112 

96 

90 

88 

7 

109 

109 

129 

102 

108 

8 

104 

112 

119 

106 

105 

9 

80 

115 

101 

95 

88 

10 

73 

111 

95 

95 

84 

11 

127 

119 

118 

107 

110 

12 

88 

112 

110 

100 

87 

13 

99 

120 

89 

105 

97 

14 

80 

117 

108 

99 

100 

15 

99 

109 

125 

108 

95 

16 

116 

116 

122 

116 

102 

17 

100 

104 

83 

100 

102 

18 

96 

110 

101 

103 

103 

19 

126 

117 

120 

113 

108 

20 

58 

120 

77 

80 

74 


a) Utilicese la rutina PROC GLM de S.4S (o algun otro paquete comparable) para 
ajustar la regresion lineal de Y sobre v,, x 2 , .t, y x t . 

b) Con base en el listado de la computadora que se obtiene en la parte a, preparese una 
tabla de analisis de varianza mostrando todas las posibles pruebas F parciales. 

c) Interpretense los coeficientes de regresion estimados y el coeficiente de correlation 
multiple. 

14.9. Empleense los datos del ejercicio 14.8 para hacer lo siguiente: 

a) Obtenganse todas las posibles ecuaciones de regresion, y para cada una calculese la 
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suma de los cuadrados de los errores, el cuadrado medio del error, el valor de C p y el 
valor R r (vease el ejercicio 14.12). 

b) Demuestrese que la regresion por pasos y el procedimiento de elimination hacia 
atras proporcionan los mismos resultados para la mejor ecuacibn de prediction. , 

c) Con base en los resultados anteriores, deduzcase la mejor ecuacibn de prediccion y 
emplbese para estimar la aptitud para el trabajo de un individuo que tiene las si- 
guientes puntuaciones, en las pruebas: x, = 105, x 2 = 110, x } = 99, y x 4 = 107. 
Obtengase un intervalo de prediccion del 95% para esta cantidad. 

14.10. De manera reciente, se ha dirigido el interes hacia el desarrollo de metodos mas rapidos 
y economicos para vigilar la concentracibn de sedimentos y contaminantes en los re- 
cursos acuiferos de cierta nacibn. Para los encargados de vigilar el medio ambiente, el 
interes principal recae en la necesidad de cuantificar los valores de concentracion en 
el agua con base en datos de perception remota. El uso de las tarnicas de perception re- 
mota para vigilar distintos parametros que miden la calidad del agua parece ser promete- 
dor. Un tipo de sistema de perception remota es la variedad pasiva d cual depende, en 
forma unica, de la radiacibn de sol como fuente de energia y mide el flujo total de radia- 
cibn emitido por el sistema agua-atmbsfera. Una componente muy grande de este flujo 
de radiacibn es el flujo de luz emitido por el agua, el cual, bajo condiciones normales, 
es una funtibn de los constituyentes que se encuentran presentes en el agua. Para medir 
el espectro de esta radiacibn se encuentran disponibles un gran numero de sistemas de 
rastreo multiespectral. Sin embargo, cada sistema tiene diferentes localizations de las 
bandas y anchos diferentes. 

Se piensa que un cambio en la concentracion de un contaminante causara un cam- 
bio en el valor del flujo de radiaciones, es decir, si se conocen los valores de la radiacibn 
para diferentes bandas espectrales, entonces es posibles predecir la concentracibn de un 
contaminante en una fuente de agua dada. El problema reside en el hecho de identifi- 
car, de entre todas las bandas, cual es la que puede predecir la concentracibn del conta¬ 
minante. En una tesis doctoral reciente, Whitlock* obtuvo datos reales de percepcibn 
remota proporcionados por un laboratorio, bajo condiciones controladas, que empleo 
cinco bandas y varios constituyentes, entre ellos el sedimento del feldespato. Los datos 
de la muestra se proporcionan en la tabla 14.30. 

a) Empleense las cinco bandas como variables de prediccion y las concentraciones de 
feldespato como la respuesta, para ajustar un modelo de regresion lineal. 

b) Calculese la matriz de correlacion para las cinco bandas de radiacibn. Interpretese 
el resultado. 

c) Usese la regresion por pasos y el procedimiento de eliminacion hacia atras, para de- 
terminar el mejor conjunto de variables de prediction. iSon los resultados identicos? 

d) Con base en los resultados anteriores, analicese cualquier aspecto que se considera 
evidente con respecto a este problema y que sirva para decidir por una ecuacion de 
prediccion adecuada. 


14.11. En la seccion 14.5 se menciono que el valor de R~ aumenta conforme se afiaden mas 
terminos a la ecuacion de regresion debido a que SCE siempre disminuye al sumar 
mas terminos y STC siempre permanece constante. Es por esta razon que se sugiere una 
medida altemativa que tome en cuenta el numero de terminos que figuran en el modelo. 


* Charles H. Whitlock, tesis doctoral, Universidad Old Dominion, mayo, 1977. 
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TABLA 14.30 Datos de la muestra para el ejercicio 14.10 


Concentration 
Y de feldespat 


Bandas de radiation 


0 X, 

Xj 

Xy 

x# 

x 5 

17 

0.297 

0.310 

0.290 

0.220 

0.156 

\ 17 

0.360 

0.390 

0.369 

0.297 

0.205 

35 

0.075 

0:058 

0.047 

0.034 

0.023 

69 

0.114 

0.100 

0.081 

0.058 

0.042 

69 

0.229 

0.213 

0.198 

0.142 

0.102 

173 

0.315 

0.304 

0.267 

0.202 

0.147 

173 

0.477 

0.518 

0.496 

0.395 

0.285 

17 

0.072 

0.063 

0.047 

0.036 

0.024 

17 

0.099 

0.092 

0.074 

0.056 

0.038 

73 

0.420 

0.452 

0.425 

0.332 

0.235 

17 

0.189 

0.178 

0.153 

0.107 

0.076 

35 

0.369 

0.391 

0.364 

0.286 

0.200 

69 

0.142 

0. P.4 

0.105 

0.077 

0.056 

35 

0.094 

0.087 

0.072 

0.049 

0.032 

35 

0.171 

0.161 

0.145 

0.094 

0.068 

52 

0.378 

0.420 

0.380 

0.281 

C.200 


Esta medida recibe el nombre de coeficiente de correlacidn multiple ajustado y se defi¬ 
ne por 



donde p es el numero de terminos que contiene el modeio, incluyendo al termino cons- 
tante. Use la informacion que se encuentra en la tabla 14.10 para demostrar que el 
coeficiente de correlacidn multiple ajustado para una regresion lineal que contiene a 
jc, , x 2 , y x 3 es mas pequefla que la de la ecuacion que solo contiene a x 2 y a x 3 . 

14.12. Empleese la ecuacion de regresion estimada en el ejercicio 14.9, parte a, que incluye solo 
a jc, , x 2 , y x A para calcular los residuos estandarizados. Entonces, grafiquense 
contra los valores correspondientes de x y Expliquese el resultado. 

14.13. Usese la ecuacion de reduccion simple estimada del eje. 13.14; calculense y grafiquense 
los residuos estandarizados frente al producto anual bruto (PAB) X. iQue se puede 
concluir? Ajustese una nueva ecuacidn de reduccion, como lo sugiere la grdfica resi¬ 
dual, para demostrar el riesgo de la extrapolation al estimar el pago de los impuestos 
porcentuales si el PAB es $ 250 000. 

14.14. Empleese la ecuacion estimada de regresion lineal simple obtenida en el ejercicio 13.13 
para calcular y graficar los residuos estandarizados contra los aflos de experiencia. Ob- 
tengase una nueva ecuacion de regresion, calculense los nuevos residuos estandariza¬ 
dos y de nuevo grafiquense contra x. iQue se puede concluir? 

14.15. Los datos que se encuentran en la tabla 14.31 representan la temperatura atmosferica 
promedio Y en enero para 50 estaciones climatologicas situadas en el estado de Virgi¬ 
nia, donde cada estacion se identifica por medio de su latitud x f , longitud x 2 y altitud x } . 
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Estacion 


numero 


x, 

*2 

JCj 

1 

37.9 

37.35 

79.52 

975 

2 

28.7 

38.52 

78.43 

3535 

3 

38.3 

37.08 

77.95 

440 

4 

37.3 

37.53 

79.68 

870 

5 

31.5 

37.08 

81.33 

3300 

6 * 

35.0 

37.38 

80.08 

1890 

7 

36.0 

38.03 

78.52 

870 

8 

37.4 

36.83 

79.37 

700 

9 

40.4 

37.28 

75.97 

II 

10 

35.8 

37.77 

78.15 

300 

II 

35.3 

38.47 

78.00 

420 

12 

33.2 

38.45 

78.93 

1400 

13 

39.3 

36.58 

79.38 

410 

14 

41.3 

36.90 

76.20 

25 

15 

34.7 

38.45 

77.67 

300 

16 

38.0 

37.33 

78.38 

450 

17 

34.2 

36.93 

80.30 

2600 

18 

35.4 

38.30 

77.47 

100 

19 

35.7 

37.37 

80.87 

1524 

20 

39.7 

36.68 

76.78 

80 

21 

40.5 

37.30 

77.30 

40 

22 

31.6 

38.00 

79.83 

2238 

23 

40.0 

37.08 

76.35 

10 

24 

36.1 

37.78 

79.43 

1060 

25 

34.1 

39.12 

77.72 

500 

26 

36.1 

38.03 

78.00 

420 

27 

33.9 

38.67 

78.38 

1200 

28 

36.6 

37.33 

79.20 

916 

29 

37.1 

36.70 

79.88 

760 

30 

28.6 

38.42 

79.58 

2910 

31 

29.3 

39.07 

77.88 

1720 

32 

37.4 

37.70 

78.30 

300 

33 

40.5 

36.90 

76.20 

22 

34 

38.9 

37.58 

75.82 

300 

35 

34.4 

36.75 

83.03 

1510 

36 

35.3 

38.50 

77.32 

12 

37 

37.5 

37.50 

77.33 

164 

38 

36.4 

37.32 

79.97 

1149 

39 

35.0 

36.88 

81.77 

1735 

40 

34.0 

38.15 

79.03 

1385 

41 

33.3 

38.65 

78.72 

1000 

42 

38.6 

37.65 

76.57 

25 

43 

37.5 

37.75 

77.05 

50 

44 

36.2 

37.85 

75.48 

9 

45 

32.1 

38.95 

77.45 

291 

46 

35.6 

38.85 

77.03 

10 

47 

39.3 

37.30 

76.70 

70 

48 

33.7 

39.20 

78.17 

760 

49 

34.4 

38.88 

78.52 

887 

50 

34.4 

36.93 

81.08 

2450 


* Fuente: Monthly normals of temperature, precipitation 
and heating and cooling degree days 1941-70, No. 81, 
NOAA, U. S. Department of Commerce. 
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a) Ajustese un modelo de regresion de segundo orden completo y llevense a cabo los 

analisis apropiados sobre sus resultados. t 

b) Usense los medios apropiados para evaluar si todos los terminos que aparecen en la 
ecuacion estimada de regresion deben retenerse. Si no es asi, proporcionense argu- 
mentos suficientes para la eleccibn de una ecuacibn de predictibn adecuada. 

14.16. Los datos de la tabla 14.32 representan la tasade crimenes Y por cada 100 000 habitan- 
tes para los 48 estados de Estados Unidos y algunas variables de prediction potenciales 
como el porcentaje de poblacion urbana x } , el porcentaje de la poblacion minoritaria 
x 2 , la tasa de desempleo x } , el porcentaje de la poblacion que tiene cuatro o mas aftos 
de education x 4 y la region geografica x } . 

a) Empleese un procedimiento de regresibn por pasos para obtener el mejor conjunto 
de variables de prediccion por incluir en un modelo lineal. 

b) Para la mejor ecuacion de prediccion, calculense los residuos estandarizados y 
grafiquense contra las regiones. <,La dispersion de estos residuos es esencialmente 
igual para todas las regiones? Si no es asi obtenganse los pesos para cada region 
mediante el empleo del procedimiento sugerido en la section 14.8 y despues utilicese 
el metodo de minimos cuadrados con factores de peso para obtener las estimaciones 
de los coeficientes de regresion del mejor conjunto de variables de prediccion. 
Comparense los resultados con los que se obtienen al emplear el metodo ordinario 
de minimos cuadrados. 

14.17. Emplense los datos del ejercicio 14.16 para obtener la matriz de correlation para todas 
las variables potenciales de prediction y la respuesta. iCuales variables de prediccion 
son las que tienen mayor correlation con la respuesta? iEsta este resultado de acuerdo 
con la parte a del ejercicio 14.16? iExisten otras variables de prediction que se en- 
cuentren muy correlacionadas? Comentese en terminos del problema de la 
multicolinealidad. 

14.18. Se cree que los salarios Y, en miles de dolares, para los profesores de cierta universidad 
por afio academico estan influenciados por tres variables: los aflos de experiencia en 
la ensenanza ; el rango academico x 2 , y la disciplina x^. Los datos que figuran en la 
taoia 14. a provienen de una muestra aleatoria de 18 profesores de esta universidad. 
Los rangos academicos se identifican por un 1 para profesor asistente, 2 para profesor 
asociado y 3 para profesor titular. Las disciplinas se identifican mediante un 1 para 
ciencias, 2 para humanidades, 3 para artes y 4 para finanzas. 

a) Definanse las variables indicadoras para el rango y la disciplina. Entonces, ajustese 
un modelo lineal con el salario como la respuesta, los afios de experiencia en la ense¬ 
nanza, como la variable cuantitativa y las variables indicadoras representan el ran¬ 
go academico y la disciplina. 

b) Interpretense los coeficientes de la regresion estimada. 

c) Ajustese un modelo lineal que incluya todos los terminos que contienen productos 
cruzados entre las variables indicadoras y x t . Llevese a cabo un analisis completo 
sobre esta ecuacion de regresion y obtenganse las conclusiones adecuadas. 

d) Para cada disciplina y rango academico, grafiquese la ecuacion de regresion estima¬ 
da obtenida en la parte c como una funcion de x t . 
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TABLA 14.32 Datos de la muestra para el ejercicio' 14.16 




Estado 

Y 

*i 

- Vl ' ’x 2 • f " 


*4 

lV; ' U 

1 

14.2 

58.4 

25.8 

7.4 

10.2 

6 

.2 

9.5 

79.6 

9.2 

9.8 

15.7 

8 

3 

8.8 

50.0 

18.4 

6.6 

911 

6 

4 

11.5 

90.9 

12.0 

8.2 

16.8 

8 

5 

6.3 

78.5 

4.7 

5.6 

19.4 

7 

6 

4.2 

77.4 

6.6 

7.1 

18.3 

1 

7 

6.0 

72.2 

15.2 

8.9 

15.5 

2 

8 

10.2 

80.5 

14.9 

9.0 

13.7 

■ 5 

9 

11.7 

60.3 

26.5 

6.9 

12.3 

5 

10 

5.5 

54.1 

1.8 

6.3 

13.5 

7 

11 

9.9 

83.0 

14.7 

6.5 

13.7 

3 

12 

7.4 

64.9 

7.6 

5.7 

11.0 

3 

13 

2.3 

57.2 

1.6 

4.0 

12.8 

4 

14 

6.6 

66.1 

5.6 

4.0 

14.6 

4 

15 

10.1 

52.3 

7.5 

4.6 

10.0 

6 

16 

15.5 

66.1 

30.2 

7.0 

11.5 

6 

17 

2.4 

50.8 

0,7 

8.9 

13.6 

1 

18 

8.0 

76.6 

21.1 

6.8 

18.6 

2 

19 

3.1 

84.6 

4.3 

9.5 

16.8 

1 

20 

9.3 

73.8 

12.5 

8.2 

12.6 

3 

21 

2.7 

66.4 

2.0 

5.9 

13.2 

4 

22 

14.3 

44.5 

36.4 

7.4 

11.5 

6 

23 

9.6 

70.1 

11.2 

6.2 

11.8 

4 

24 

5.4 

53.4 

4.8 

6.2 

14.2 

7 

25 

3.9 

61.5 

3.8 

5.0 

12.8 

4 

26 

15.8 

80.9 

8.3 

9.0 

13.1 

8 

27 

3.2 

56.4 

0.7 

6.4 

15.3 

1 

28 

5.6 

88.9 

12.8 

9.4 

14.9 

2 

29 

8.8 

69.8 

9.8 

7.8 

15.3 

8 

30 

10.7 

88.9 

14.6 

9.1 

16.0 

2 

31 

10.6 

45.0 

23.1 

6.2 

11.8 

5 ■ 

32 

0.9 

44.3 

3.3 

5.5 

12.2 

4 

33 

7.8 

75.3 

10.1 

7.8 

11.5 

3 

34 

8.6 

68.0 

11.3 

5.0 

11.7 

6 

35 

4.9 

67.1 

3.0 

9.5 

15.4 

7 

36 

5.6 

71.5 

9.4 

7.9 

11.9 

2 

37 

3.9 

87.1 

3.7 

8.6 

14.9 

1 

38 

11.9 

47.6 

31.2 

5.0 

10.4 

5 

39 

2.0 

44.6 

6.1 

3.6 

11.4 

4 

40 

10.1 

58.7 

15.9 

6.0 

10.5 

6 

41 

13.3 

79.7 

13.1 

5.7 

13.7 

6 

42 

3.5 

80.4 

2.5 

5.3 

17.5 

7 

43 

1.4 

32.2 

0.8 

8.0 

15.6 

1 

44 

9.0 

63.1 

19.5 

5.6 

16.4 

5 

45 

4.3 

72.6 

5.1 

8.8 

16.1 

7 

46 

6.0 

39.0 

3.9 

7.5 

9.2 

5 

47 

2.8 

65.9 

3.9 

4.5 

12.7 

3 

48 

5.4 

60.5 

3.1 

3.6 

14.5 

7 


Fuente: World almanac, 1979 
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TABLA 14.33 Datos de la muestra para el ejercicio 14.18 


Y 

X\ 

*2 

x. 

25.7 

10 

1 

2 

18.8 

4 

1 

1 

18.6 

5 

1 

3 

21.8 

13 

2 

3 

26.3 

4 

1 

4 

29.4 

24 

3 

3 

28.6 

7 

2 

2 

34.5 

12 

3 

4 

24.3 

II 

2 

1 

21.2 

6 

1 

3 

28.8 

6 

1 

4 

24.7 

4 

I 

2 

32.4 

12 

3 

2 

33.4 

20 

3 

1 

27.4 

11 

2 

1 

29.8 

6 

2 

4 

31.4 

11 

2 

4 

27.7 

8 

2 

3 
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CAPfTULO QUINCE 


Metodos no parametricos 


15.1 Introduction 

Los procedimientos inferenciales que hasta este momento se han estudiado, con ex¬ 
ception de los limites de tolerancia independientes de distribution analizados en el 
capitulo 8, y de la estadistica de Kolmogorov-Smirnov, presentada en el capitulo 10, 
necesitan de la especificacion de una distribution para la poblacion de interes. Por 
ejemplo, el procedimiento del analisis de varianza se hace posible al asumir que las 
observaciones provienen de distribuciones normales. De esta forma, la mayor parte 
de los procesos inferenciales que se han presentado representan estimaciones con 
respecto a los parametros de la poblacidn de interes. Por esta raz6n, este tipo de in- 
ferencias reciben el nombre de metodos parametricos. 

Para muchos de los metodos inferenciales que se han examinado se ha hecho un 
intento por determinar su robustez, y en muchas ocasiones se ha encontrado que los 
metodos son razonablemente robustos con respecto a las distribuciones supuestas. 
No obstante, en general los metodos parametricos son mas sensibles a las suposi- 
ciones para muestras de tamaflo pequefto y, para muchos de ellos, su aplicacion se 
encuentra limitada a aquellas observaciones que tienen un caracter cuantitativo, es 
decir, se supone que lo que se observa es una cantidad numerica continua como el vo- 
lumen de ventas semanal, la cantidad de cierta sustancia que se vacia en un recipien- 
te, la resistencia de una muestra de metal y otros mas. 

Las observaciones de tipo cuantitativo se definen, en forma general, sobre un in- 
tervalo o sobre una escala de proporciones. Las mediciones que se definen en una es- 
cala de intervalo se pueden distinguir y ordenar en forma numerica, y sus diferencias 
son significativas. Un ejemplo clasico de una escala de intervalo es aquel que incluye 
la medicion de la temperatura. Puede escogerse entre registrar la temperatura en gra- 
dos Celsius (para los cuales el punto de congelation del agua es de 0°C) o en grados 
Fahrenheit (para los que el punto de congelation es de 32°F). De esta forma el ori- 
gen de las escalas es diferente, pero el significado de la diferencia entre 10°C y 15°C 
es el mismo que tiene la diferencia entre 20°C y 25°C. 

Si una medicion reune los requisitos de una escala de intervalo y ademas tiene un 
verdadero punto de origen, entonces la medicion se define sobre una escala de pro- 
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porciones. Por ejemplo, las alturas, los pesos, las resistencias y otros se encuentran 
definidos sobre una escala de proporciones ya que tienen verdaderos puntos cero, 
sin importar la unidad de medicibn. Las escalas de intervalo y de proporcibn son 
verdaderamente cuantitativas. Para la mayor parte de los metodos parametricos que 
se ban presentado, como son la construccibn de intervalos de confianza, la prueba de 
hipdtesis estadisticas y el ajuste de ecuaciones son aplicables a todas aquellas obser¬ 
vations que se encuentran definidas, por lo menos, sobre una escala de intervalo. 

Sin embargo, en muchas situaciones lo que se observa tiene un car&cter cualitati- 
vo (no cuantitativo) y, por lo tanto, no puede definirse sobre una escala de intervalo o 
de proporciones. Tales situaciones se encuentran con frecuencia en las ciencias so- 
ciales y en las encuestas de mercado. Por ejemplo, no es probable que al evaluar las 
preferencias del consumidor con respecto a una bebida, se adhieran a una escala nu- 
merica significativa, inclusosi se le pidiese al consumidor su opinion con respecto a 
la bebida en una escala de cinco puntos, donde 1 y 5 pueden representar reacciones 
muy n^gativas o muy positivas, respectivamente, la escala es arbitraria. En otras pa- 
labras, los numeros no tienen ningun significado fisico mas alia que el de representar 
con un numero mas grande la respuesta mas favorable para la bebida. 

Las observaciones de este tipo pueden definirse sobre una escala ordinal, dado 
que la distancia entre dos puntos no es de consecuencia y solo es importante el orden 
o rango de los numeros. En algunas ocasiones, las observaciones solo pueden defi¬ 
nirse sobre una escala nominal debido a que se emplea, ya sea un nombre (simbolo) o 
un numero para clasificar una caracteristica de interes, pero el principio de orden no 
es de consecuencia. Por ejemplo, las personas pueden clasificarse de acuerdo con su 
sexo. Pueden emplearse los simbolos My H o utilizar numeros como 122 y 48 para 
denotar mujer u hombre. Las observaciones que se definen sobre escalas nominales 
son mediciones con pocas propiedades. 

Se han desarrollado procedimientos inferenciales que no se encuentran sujetos a 
la forma de la distribution de la poblacibn de interes y no requieren, en forma nece- 
saria, que las observaciones se definan por lo menos en una escala de intervalo. Es- 
tos procedimientos inferenciales se conocen como metodos no parametricos. Dado 
que estos metodos no necesitan que se especifique la forma de la distribucibn de la 
poblacibn de interes, tambien se conocen como metodos independientes de la distri- 
bucidn (recuerdese, por ejemplo, los limites de tolerancia independientes de la 
distribucion estudiados en el capitulo 8). En un sentido relativo, los metodos para¬ 
metricos requieren de pocas suposiciones y, la mayor parte de las veces, son mas fa- 
ciles de aplicar que los procedimientos parametricos que se han presentado en los 
capitulos anteriores; ademas, los metodos no parametricos pueden aplicarse en 
aquellas situaciones para las que las observaciones se definen, por lo menos, en una 
escala de intervalo y, en ocasiones, sobre escalas nominales. Pero si las observa¬ 
ciones se definen por lo menos en una escala de intervalo y la distribucion de la 
poblacion de interes es normal, los metodos no parametricos son menos eficientes 
comparados con los procedimientos parametricos que se basan en la suposicion de 
normalidad. 

Se han desarrollado muchos metodos parametricos en los que se han incluido 
procedimientos de analisis de varianza y de regresion. Las referencias citadas al final 
del capitulo proporcionan un panorama completo de todos los metodos no para- 
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metricos. El prop6sito de este capitulo radica s61o en introducir los conceptos b6si- 
cos y presentar, algunos metodos que son,en forma especial, utiles. Estos procedi- 
mientos no parametricos son comparables; con los metodos parametricos para la 
prueba de hipdtesis con respecto- a las medias de dos distribuciones normales inde- 
pendientes (seccion 9.6.2), la prueba de hip6tesis con respecto a las medias para ob- 
servaciones igualadas (secci6n 9.6.4), experimentos unifactoriales en diseflos y en 
bloque completamente aleatorios (seccion 12.4 y 12.5) y correlation lineal (seccion 
13.8). 


15.2 Pruebas no parametricas para comparar dos poblaciones 
con base en muestras aleatorias independientes 

En la secci6n 9.6.2 se considerd el problema de comparar las medias de dos distribu¬ 
tions c 'ando se supone que son normales. En esta seccibn se analizaran dos proce- 
dimientos no parametricos para comparar las distribuciones de dos poblaciones: la 
prueba U de Mann-Whitney y la prueba de tendencias de Wald-Wolfowitz. La unica 
suposicion necesaria para su aplicacion es que las distribuciones de interes sean conti- 
nuas. De acuerdocon loanterior, sesupondraque X,, X 2 , ..., X n y Y t , Y 2j ..., Y n 
son muestras aleatorias independientes de dos poblaciones con distribuciones continuas. 

15.2.1 Prueba de Mann-Whitney 

Dadas muestras aleatorias independientes de dos poblaciones, considerese la prueba 
de la hip6tesis nula de que las poblaciones tienen la misma distribucion. La hipotesis 
puede establecerse como 


H 0 :f,(x)=f 2 (y), (15.1) 

donde f,(x) y f 2 (y) son las correspondientes funciones de densidad de probabili- 
dad. La hipotesis altemativa puede ser uni o bilateral. La hipdtesis alternativa bila¬ 
teral establece en forma sencilla que las distribuciones no son las mismas. Pero la hi¬ 
potesis alternativa s61o implica un desplazamiento en la tendencia central de una 
distribucion con respecto a la otra y no sugiere una diferencia en la forma o en la 
dispersibn. En otras palabras, al igual que para el procedimiento t de Student, se 
supone que las distribuciones tienen la misma forma y dispersion. 

Un procedimiento popular no parametrico para probar la hipotesis nula dada 
por (15.1) es la prueba U de Mann-Whitney * Esta prueba es el equivalente no para¬ 
metrico de la prueba / de student para dos muestras estudiada en la seccion 9.6.2. La 
prueba de Mann-Whitney se basa en una combinacion de las «, y n 2 observaciones 
para formar un solo conjunto de n, + n 2 observaciones arregladas en orden cre- 
ciente de magnitud. Entonces se asigna un rango a cada observacion en la secuencia 
ordenada que comienza con un rango 1 y termina con un rango n , + n 2 . Si las 
muestras aleatorias provienen de poblaciones que tienen la misma distribucion, se 
espera que los rangos se encuentren lo suficientemente dispersos cuando se observa 


Este procedimiento es, en forma esencial, igual a la prueba de Wilcoxon de la suma del rango. 
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en qu6 muestra se encuentran las observaciones. De otra forma, debe esperarse que 
los rangos de las observaciones en cada muestra se encuentren muy agrupados 
en los extremos. En esencia, la estadistica de Mann-Whitney determina cu4ndo un 
agregado de rangos observados es suficiente para concluir que las dos miiestrhs alea. 
torias provienen de poblaciones cuyas distribuciones difleren en la tendencia central; 

Para implementar el procedimiento se v obtiene la suma de los rangos asodados 
con las observaciones de una de las dos mufestras, por ejemplo la muestra 1, la cual . 
se escoge en forma arbitraria. Denotese esta suma por R,. Entonces la estadistica U 
de Mann-Whitney esta dada por 


U = /i |/r 2 


+ 


n i(n, + 1) 
2 


R i. 


(15.2) 


La estadistica U cs una funcion de la variable aleatoria R, y de los tamaftos de las 
muestras n x y n 2 . Si H 0 es cierta, la ocurrencia de cualquier orden particular para 
las observaciones en el conjunto combinado es equiprobable. Por lo tanto, bajo H 0 , 
R t es la suma de n, enteros positivos seleccionados en forma aleatoria de entre los pri- 
meros n x + n 2 . De acuerdo con lo anterior, puede determinarse que 


E(R\) = n x (n t + n 2 + l)/2, 

(15.3) 

Var(R t ) = n l n 2 (n l + n 2 + 1)/12. 

(15.4) 

De (15.2) sigue que 


E(U) = n x n 2 + 2 £(/?,) = n x n 2 /l. 

(15.5) 

y 

Var(U) = Var(R x ) = n l n 2 (n ] + n 2 + 1)/12. 

(15.6) 


Se ha determinado y tabulado la distribucion exacta de U. Se invita al lector a 
que consulte [1] y [2] para conocer los detalles. Para una hipdtesis alternativa bilate¬ 
ral, es probable que se rechace //„ si se obtiene un valor muy grande o muy pequefto 
de U. Lo anterior ocurrira cuando el valor de R t es muy grande o muy pequefio, res- 
pectivamente. Sin embargo, cuando tanto n, y n 2 son mayores de 10, la distribucion 
de U se encuentra, en forma adecuada, aproximada por una distribucion normal con 
media y varianza dadas por (15.5) y (15.6), respectivamente, es decir, bajo H 0 la va¬ 
riable aleatoria 


= U ~ E(U) 

\/Var(U) 

es aproximadamente N(0, 1) para valores grandes de «, y n 2 . 

Debe notarse que a pesar de que no pueden ocurrir empates en la practica desde 
un ppnto de vista teorico, esto ocurre en muchas ocasiones. Cuando ocurre un em- 
pate en la secuencia ordenada, se sugiere asignar el promedio de los rangos a las ob¬ 
servaciones para las cuales ocurre el empate. Por ejemplo, supongase que las obser- 
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vaciones octava y novena en la secuencia ordenada son las mismas. Entonces a cada 
una de estas observaciones se les asigna un rango de 8.5. 

Ejemplo 15.1 Se sospecha que una compaflia lleva a cabo una politica de discrimi¬ 
nation, con respecto al sexo, en los salarios de sus empleados. Se seleccionaron 12 
empleados masculinos y 12 femeninos de entre los que tienen responsabilidades y ex- 
periencia similares en el trabajo; sus salarios anuales en miles de dOlares son los si- 
guientes: 

Mujeres 22.5 19.8 20.6 24.7 23.2 19.2 18.7 20.9 21.6 23.5 20.7 21.6 

Hombres 21.9 21.6 22.4 24.0 24.1 23.4 21.2 23.9 20.5 24.5 22.3 23.6 

<,Existe alguna razon para creer que estas muestras aleatorias provienen de pobla- 
ciones con diferentes distribuciones? Usese a = 0.05. 


Se combinan los salarios de las dos muestras para formar un solo conjunto de 24 
salarios anuales. Entonces se ordenan los salarios y se les asigna un rango de la si- 
guiente manera: 


Sexo 

M 

M 

M 

H 

M 

M 

M 

H 

H 

M 

M 

H 

Rango del 

18.7 

19.2 

19.8 

20.5 

20.6 

20.7 

20.9 

21.2 

21.6 

21.6 

21.6 

21.9 

salario 

1 

2 

3 

4 

5 

6 

7 

8 

10 

10 

10 

12 


Sexo 

H 

H 

F 

M 

H 

M 

H 

H 

H 

H 

H 

M 

Rango del 

22.3 

22.4 

22.5 

23.2 

23.4 

23.5 

23.6 

23.9 

24.0 

24.1 

24.5 

24.7 

salario 

13 

14 

15 

16 

17 

18 

19 

20 

21 

22 

23 

24 


Para obtener la suma de los rangos se seleccionara la muestra de mujeres. De esta 
forma la suma de los rangos es 

1 + 2 + 3 + 5 + 6 + 7 + 10 + 10 + 15 + 16 + 18 + 24 = 117, 
y el valor de la estadistica U de Mann-Whitney es 

.« = (12)(12) + - 117 = 105. 

Dado que E(U) = (12)(12)/2 = 72 y Var(U) = (12)(12)(25)/12 = 300, median- 
te el empleo de la aproximacion normal, 

z = (105 - 72)/V300 = 1.91 

es un valor de una variable aleatoria normal estandar. Para a = 0.05, los valores 
criticos son ± 1.96. Por lo tanto, no puede rechazarse la hipotesis nula de que las 
muestras aleatorias provienen de poblaciones con distribuciones identicas. j 
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15.2.2 Prueba de tendencias de Wald-Wolfowitz 

Otro metodo no parametrico que compara las distribuciones de dos poblaciones con 
base en muestras aleatorias independientes es la prueba de tendendas de Wald- 
Wolfowitz. Para esta prueba, la hipdtesis nula es que las dos muestras afcatorias pro- 
vierien de poblaciones que tienen distribuciones identicas, pero a diferenca de la 
prueba U de Mann-Whitney, no sugiere una diferencia s61o en la tendencia central; 
es decir, la hipbtesis alternativa en la prueba de Wald-Wolfowitz es mucho mbs 
amplia. Esta establece simplemente que las distribuciones difieren en algun aspecto 
como en la tendencia central, en la dispersibn o la asimetria. 

A1 igual que en la prueba de Mann-Whitney, las observaciones en las dos 
muestras aleatorias se combinan y ordenan de acuerdo con sus magnitudes. Pero en 
lugar de considerar los rangos, el procedimiento de Mann-Wolfowitz busca el nume- 
ro de tendencias en la secuencia ordenada. 

Definicibn 15.1 Se define una tendencia de longitud j como una secuaicia d ej ob¬ 
servaciones, toduS pertenecientes al mismo grupo, que se encuentran, yasea precedi- 
das o seguidas por observaciones que pertenecen a un grupo diferente. 

Como ilustracion, recuerdese la secuencia ordenada del ejemplo 15.1. La secuen¬ 
cia ordenada de acuerdo con el sexo de los empleados es la siguiente: 

F FFMFFFMMFFM 
MMFF MFMMMMMF 


Para el sexo del empleado, la secuencia ordenada exhibe tendencias de M y H. En 
particular, la secuencia comienza con una tendencia de longitud tres, seguida por 
una tendencia de longitud uno, seguida por otra de longitud tres, y asi consecutiva- 
mente. El numero total de tendencias en esta secuencia es de 11. 

Si la hipbtesis nula de que las distribuciones son identicas es cierta, las observaciones 
de las dos muestras en la secuencia ordenada deben encontrarse bien mezdadas, produ- 
ciendo de esta forma un numero grande de tendencias. Pero si las distribuciones de inte- 
res difieren en algun aspecto, es probable que la secuencia ordenada contenga tendencias 
de corta longitud obteniendose de esta forma un numero total de tendencias pequeiio. 

Sea R el numero total de tendencias observadas en una secuencia ordenada de 
n s + n 2 observaciones, donde n , y n 2 son los respectivos tamafios de las muestras. 
Los posibles valores de R son 2. 3, ..., («, + n 2 ). Puede demostrarse que la fun- 
cion de probabilidad de R esta dada por 


2 


( n, - 1 

V/2 - 1 



p(r) = 


('"; i 


r/2 - \/2j\r/2 - 3/2 


n? — 


+ 







r par. 


(15.7) 


r impar. 
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La media y la varianza de R son 
i .. - E{R) = 

\ / , Var(R) = 


! . 


2n '"'- + 1 , . 

(15.8) 

n, + n 2 

•; 1 ... -i*.‘ 

2n^n 2 (ln^n 2 - n, - n 2 ) 

(/!, + n 2 f(n, + n 2 - 1)' 

V (15.9) 


Para probar H 0 con una probabilidad a, para el error de tipo I, debe encontrarse 
un entero r 0 tal, que en la medida de lo posible 

r o 

'Z p( r ) = “• 

r = 2 

Se rechaza la hipotesis nula cuando el numero observado de tendencias es menor o 
igual a r 0 . Notese que la region critica es una region unilateral inferior dado que se 
rechaza H 0 cuando e! numero de tendencias es bastante pequeflo. 

La distribucion acumulativa de R se encuentra tabulada en forma extensa; pero 
si tanto n, como n 2 son mayores que 10, la distribucion de R se encuentra, en forma 
adecuada, aproximada por una distribucion normal con media y varianza dadas por 
(15.8) y (15.9), respectivamente. Como ilustracion, recuerdese el ejemplo 15.1. El nu¬ 
mero observado de tendencias es 11, y para n , = n 2 = 12 los valores de la media y 
la varianza de R son 13 y 5.7391, respectivamente. Entonces, mediante el empleo de la 
aproximacibn normal, 


z = (11 - 13)/\/5.7391 = -0.83 


es un valor de una variable aleatoria normal estandar. Para a = 0.05, se observa 
que la hipotesis nula no puede ser rechazada. 

En la aplicacion de la prueba de tendencias de Wald-Wolfowitz surge un proble- 
ma muy serio cuando ocurren empates entre las observaciones que se encuentran en 
grupos diferentes. Este problema se debe a que el numero de tendencias depende de 
como se manejen los empates en la secuencia ordenada. El procesamiento que se su- 
giere en estos casos es el de ordenar las observaciones empatadas en forma tal, que 
sea lo menos favorable para el rechazo de H 0 . Pero si se tienen muchos empates, la 
validez de la prueba de Wald-Wolfowitz es cuestionable. 

Por causa de la naturaleza extensa de la hipotesis alternativa en la prueba de 
Wald-Wolfowitz, esta y la prueba de Mann-Whitney no son comparables. Si un in- 
vestigador desea comparar las tendencias centrales de las distribuciones de dos 
poblaciones y solo se tienen observaciones ordinales disponibles, la estadistica de 
Mann-Whitney es el procedimiento no parametrico mas poderoso para detectar dife- 
rencias entre las tendencias centrales. Si se va a hacer una comparacion mas amplia, 
la prueba de Wald-Wolfowitz es un procedimiento viable pero menos poderoso. 


15.3 Pruebas no parametricas para observaciones por pares 

En la seccion 9.6.4 se considero la comparacion entre las medias de dos tratamientos 
cuando las observaciones se encuentran igualadas con el proposito de eliminar los 
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efectosicausados por factores extemos. En esta secci6n se discutiran dos pruebas no 
parametricas que son equivalentes al procedimiento t de Student de la seccion 9.6.4. 
Estas son la prueba del signo y la prueba de rangos y signos de Wilcoxon. 

15.3.1 La prueba del signo 

La prueba del signo se basa en los signos de las diferencias entre las 
observaciones por pares de dos variables aleatorias Xy Y. Sean {X u L,), {X 2 , Y 2 ),.... 
( X n , K„) pares de n observaciones muestrales de las distribuciones de X y Y, 
donde se supone que estas son continuas . En muchas ocasiones existe una relacion 
natural entre Xy Y, por lo que Xy Y no necesitan ser independientes. Por ejemplo, 
Xy Y pueden representar las respuestas de parejas de matrimonios. 

Para cada par en el que X es mayor que Y se registra un signo (+) de otra forma 
se registra un signo (-). Dado que se supone que las distribuciones de Xy Y son con¬ 
tinuas, en forma teorica, no pueden ocurrir empates. Sea p la probabilidad de que X 
sea mayor que Y. Entonces si la hipotesis nula es que Xy Y tienen la misma distribu- 
ci6n, el valor de p debe ser igual a 0.5. Sin embargo, debe notarse que p puede ser 
igual a 0.5, aun cuando las distribuciones de X y Y no sean idfenticas. Por lo tanto, y 
en esencia, la hipotesis nula para la prueba del signo es 

H 0 : p = 0.5, 

La cual puede probarse contra hipbtesis alternativas, ya sean uni o bilaterales, lo cual 
depende de lo que el investigador desee. Notese que si H 0 es cierta, debe esperarse 
que, en forma aproximada, la mitad de los n pares tengan signos +. 

La estadlstica para la prueba del signo, denotada por S, es el numero de signos + 
entre los n pares. Dado que bajo H 0 cada par constituye un ensayo independiente 
con una probabilidad para el signo + de 0.5, la estadistica S tiene una distribucion 
binomial con p = 0.5. De acuerdo con lo anterior, para n dado y p - 0.5, se emplea 
la distribucion binomial para obtener las regiones criticas de tamafio a para el error 
de tipo I. Para valores grandes de n puede utilizarse la aproximacion normal de la 
distribucion binomial, estudiada en la seccion 5.2. 

Cuando ocurren empates al aplicar la prueba del signo, el procedimiento que se 
recomienda seguir es el de ignorarlos y emplear la prueba solo para aquellos pares en 
los que no ocurren empates. Este procedimiento puede representar un problema si se 
tienen numerosos empates y el numero original de pares es relativamente pequeflo. 


Ejemplo 15.2 Se seleccionaron al azar 10 parejas de recien casados, y se les pre- 
gunto por separado, tanto al marido como a la esposa, cu&ntos hijos deseaban tener. 
Se obtuvo la siguiente informacion. 


Pareja 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

Esposa X 

3 

2 

1 

0 

0 

1 

2 

2 

2 

0 

Marido Y 

2 

3 

2 

2 

0 

2 

1 

3 

1 

2 


Mediante el empleo de la prueba del signo, ^existe alguna razon para creer que las 
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esposas desean menos hijos que sus esposos? Supongase un tamaflo maximo del 
error del tipo I de 0.05. ^ r ' ,r \ : -: - 



Considerese la prueba de la hipotesis nula 

H 0 : p = 0.5 

4 

contra la altemativa 

: p< 0.5. 

Notese que debera rechazarse H 0 si el numero de signos + es muy pequeflo. A1 res¬ 
tar las respuestas de cada esposo de la de su esposa, y notando que las respuestas de 
cinco de las parejas son las mismas, se obtiene el siguiente arreglo de signos + y 


Pareja 

1 

2 

3 

4 

6 

7 

8 

9 

10 

Signo 

+ 

- 

- 

- 

- 

+ 

- 

+ 

- 


Existen tres signos + de manera tal, que el valor de la estadistica S es 3. Dado 
que bajo H 0 , S es binomial con n = 10 y p = 0.5, el valor p, o la probabilidad de 
observar tres o menos signos +, se obtiene de la tabla A del apendice y es 

P(S =s 3) = 0.2539. 

Dado que 0.2539 es mayor que a = 0.05 la hipotesis nula no puede rechazarse. No¬ 
tese que para este ejemplo el valor critico de S debe ser igual a uno si el tamaflo maxi¬ 
mo del error de tipo I es de 0.05. 

15.3.2 Prueba de rangos de signos de Wilcoxon 

La prueba del signo considera solo las diferencias en el signo entre cada par de ob- 
servaciones e ignora sus magnitudes. Si las observaciones se definen sobre una escala 
ordinal, las magnitudes de las diferencias tienen poco valor. Pero si las observa¬ 
ciones son magnitudes fisicas, la prueba del signo puede ignorar mucha informacion 
debido a que no se toman en cuenta las magnitudes de las diferencias. La prueba de 
rangos y de signos de Wilcoxon toma en cuenta tanto el signo como la magnitud de las 
diferencias entre cada par de observaciones. Por lo tanto, para tener un buen ba¬ 
lance, este es el mejor metodo no parametrico por utilizar para observaciones en pa¬ 
rejas. 

Para implementar la prueba de Wilcoxon, se obtienen las diferencias para los n 
pares de observaciones. Entonces, se ordenan sin importar el signo y de acuerdo con 
este orden se les asigna un rango, es decir, la diferencia mas pequefla recibe un rango 
uno y a la diferencia absoluta mas grande se le asigna un rango igual a n. Entonces, 
el signo de cada diferencia se une al rango de esta. Los empates entre las diferencias 
se manejan de la misma manera que en la prueba de Mann-Whitney, pero si una di¬ 
ferencia es igual a cero, el procedimiento que se sugiere es omitir el par y ajustar n. 

La estadistica de la prueba de Wilcoxon es la suma de los rangos positivos y se 
denota por 7'+. Notese que 7* contiene no solo informacion proporcionada por la 
estadistica de la prueba del signo sino tambien informacion con respecto a la magni- 
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tud relativa de las diferencias. Si la hip6tesis nula de que las observaciones en cada 
par provienen de distribuciones identicas es cierta, la ocurrencia de cualquiersecuen- 
cia, en particular de los rangos y signos, es equiprobable de entre las 2 n secuencias po- 
sibles de signos + y Bajo la hipbtesis nula, se espera que T+ tenga el mismo valor; 
aproximadamente, que la suma de las magnitudes de los rangos negativos. Por lo 
tanto, dependiendo de la naturaleza de la hipbtesis alternativa, se rechaza H 0 cuando 
se observa un valor de T + suficientemente grande o pequeflo. 

Se ha determinado y tabulado la distribution exacta de T + . Sin embargo, al igual 
que para algunas otras estadisticas, la distribucibn de muestre de T + se encuentra 
aproximada, en forma adecuada, por una distribucibn normal para n > 10, donde 

E{T + ) = n(n + l)/4, (15.10) 

Vat(T + ) = n(n + 1)(2 n + l)/24. (15.11) 

En otras palabras, la variable aleatoria 

7 _ T + ~ E ( T -1 
\JVar{T + ) 

es aproximadamente N(0, 1) para valores grandes de n. 

Ejemplo 15.3 De una clase de estadistica se seleccionan al azar 11 estudiantes y se 
observan sus calificaciones en dos examenes sucesivos. Para las calificaciones dadas 
en la tabla 15.1, utilicese la prueba de rangos y de signos de Wilcoxon para determi- 
nar si el segundo examen fue mas dificil que el primero. Usese a =0.1. 

En la tabla se encuentran las diferencias (examen 1 - examen 2), rangos, y rangos 
con signos para los 11 estudiantes. Dado que se desea determinar si el segundo exa¬ 
men fue mas dificil que el primero, la hipbtesis alternativa es unilateral, y la regibn 
critica se encuentra en el extremo superior de la distribucion de muestreo de T + es 
decir, si el valor observado de la suma de los rangos positivos es grande, lo anterior 


TABLA 15.1 Datos de la muestra para el ejemplo 15.3 


Estudiante 

Prueba 1 

Prueba2 

Diferencia 

Rango 

Rango con signo 

1 

94 

85 

9 

8 

8 

2 

78 

65 

13 

10 

10 

3 

89 

92 

-3 

4 

-4 

4 

62 

56 

6 

7 

7 

5 

49 

52 

-3 

4 

-4 

6 

78 

74 

4 

6 

6 

7 

80 

79 

1 

1 

1 

8 

82 

84 

-2 

2 

-2 

9 

62 

48 

14 

11 

11 

10 

83 

71 

12 

9 

9 

11 

79 

82 

-3 

4 

-4 
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implicaria tener calificaciones bajas, en forma suficiente, para el examen 2, y debe 
rechazarse la hipbtesis nula de no diferenda. 

La suma de los rangos positivos es^8 + 10 + 7 + 6 + 1 + 11 + 9 = 52. 
Para n = 11, los valores de la media y la varianza de T + son E(T+ ) =. 33 y 
Var(T + ) = 126.5. Entonces, mediante el empleo de la aproximacion normal, r 


52 - 33 
V126.5 


1.69. 


Para a = 0.1, z 09 = 1.28, y por lo tanto se rechaza la hipbtesis nula. 


15.4 Prueba de Kruskal-Wallis para k muestras aleatorias 
independientes 

Recuerdese el procedimiento parametrico del analisis de varianza de la seccion 12.4, 
en el que el interes radica en probar la hipbtesis nula 

H 0 - Mi = M2 = "• = 

con base en k muestras aleatorias mutuamente independientes provenientes de 
poblaciones cuyas distribuciones se suponen como normales. Se han desarrollado 
metodos no parametricos para, de manera esencial, el mismo propbsito siempre que 
por lo menos se encuentren disponibles mediciones ordinales y las distribuciones de 
las poblaciones de interes sean continuas. Uno de estos metodos es el procedimiento 
de Kruskal- Wallis, el cual prueba las hipbtesis nulas de que los efectos de los trata- 
mientos son los mismos, o que las k muestras aleatorias provienen de poblaciones 
con distribuciones identicas. 

Sean las observaciones de las k muestras aleatorias las dadas en la tabla 15.2, 
donde rij es el tamafio de la y-esima muestra y N = X*, |AZ 7 es el numero total de 
observaciones para todas las muestras. 

La hipbtesis nula puede establecerse como 

H 0 : /,(y)=/ 2 (y)= •• =My) (15.12) 

donde / 2 (y), • ■ •, A( v) son las correspondientes funciones de densidad de 
probabilidad. La hipbtesis alternativa puede ser general y establecer solo que las k 


TABLA 15.2 Observaciones de k muestras aleatorias para la prueba de Kruskal-Wallis 


1 

2 

Muestra 

j 

k 

I'll 

Y,2 

Y\, 

1*11 

r 2 l 

y 22 

Yi, 

Yu 


Y„, 2 

Y *,> 

Y„ k 

n k x 
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distribuciones no son idbnticas. Sin embargo, la prueba de Kruskal-Wallis es sen¬ 
sible ia las diferencias en tendencia central y es muy util cuando se sospecha que las 
distribuciones de interes difieren s61o en ese aspecto. De acuerdo con lo anterior, el 
procedimiento de Kruskal-Wallis se considera, en general, como una extensibn de la 
prueba U, de Mann-Whitney. - 

A1 igual que en la prueba de Mann-Whitney, el procedimiento de Kruskal-Wallis 
se basa en la combinacibn de todas las observaciones en las muestras aleatorias para 
formar un solo conjunto de N observaciones; entonces, estas se arreglan en orden. 
creciente de magnitud y se asigna un rango a cada observacibn comenzando con un 
rango 1 y terminando con un rango N. Cuando el rango de todas las observaciones 
esta completo, se determina la suma de los rangos para cada muestra. Sea Rj la suma 
de los rangos de la y-esima muestra. En esencia, la prueba de Kruskal-Wallis deter¬ 
mina si la disparidad entre las Rj con respecto a los tamafios rij de las muestras es 
suficiente para garantizar el rechazo de la hipbtesis nula. 

Bajo la suposicion de que las k muestras provienen de poblaciones con distribu¬ 
ciones ideriticas, la estadistica de ia prueba de Kruskal-Wallis es 



la que para tamafios n, relativamente grandes de las muestras se encuentra aproxi- 
mada, en forma adecuada, por una distribucion chi-cuadrada con k -1 grados de li- 
bertad. Para un tamaflo especifico del error de tipo I, la region critica es la porcion 
superior de la distribucibn chi-cuadrada. De acuerdo con lo anterior, se rechaza la 
hipbtesis nula para valores grandes de la estadistica de la prueba de Kruskal-Wallis. 
Debe notarse que la aproximacibn chi-cuadrada es, por lo general, satisfactory, ex- 
cepto cuando k = 3 y ninguno de los tamafios de las muestras n } sea mayor que cinco. 

El procedimiento que se recomienda para manejar los empates es igual al de la 
prueba de Mann-Whitney. Si el numero de empates es grande, se ha propuesto un 
factor de correction para la estadistica de pruebas dada por (15.3); veanse cuales- 
quiera de las referencias que se encuentran al final de este capitulo. A pesar de que 
esta correcion siempre incrementa el valor de la estadistica de prueba, en muchos ca- 
sos este efecto es despreciable, aun si existen numerosos empates. 


Ejemplo 15.4 Se tomaron muestras aleatorias independientes de casas reciente- 
mente vendidas en cuatro zonas residenciales de una gran ciudad. El problema era 
determinar si existian diferencias en las zonas con respecto al valor de la propiedad y 
el precio de venta. Los datos que figuran en la tabla 15.3 son los cocientes entre los 
precios de venta y el valor catastral de la propiedad. Para a = 0.05,empleese la 
estadistica de Kruskal-Wallis para probar si estas muestras provienen de poblaciones 
con distribuciones identicas. 


Los valores que se encuentran entre parentesis en la tabla son los rangos 
de las observaciones despues de haberlas combinado y ordenado. Nbtese que 
«, = n 4 = 5, n 2 = n 3 = 6. y N = 22. Las sumas de los rangos de cada muestra 
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TABLA 15.3 

Datos de la muestra para el ejemplo 15.4 



■ Zona residencial 


- ;i 1 


3 

4 

1.19 (15) 

1.08(4.5) 

0.98 (2) 

1.12 (7.5) 

1.05 (3) 

1.23 (17.5) 

1.19 (15) 

1.14 (10) 

1.14 (10) V 

1:26 (20) 

1.08 (4.5) 

1.31 (22) 

1.25 (19) 

1.10(6) 

0.93 (1) 

1.12 (7.5) 

1.29 (21) 

1.18 (12.5) 

1.23 (17.5) 

1.19 (15) 


1.14 (10) 

1.18 (12.5) 



son /?, = 68, R 2 = 70.5, R 3 = 52.5, y R 4 = 62. Entonces el valor de la 
estadistica de Kruskal-Wallis es 


h = 


12 

(22)(23) 


(68) 2 (70.5) 2 

5 + 6 


(52.5) 2 



— 3(23) = 1.70. 


De la tabla E del apendice, para a = 0.05 y k - 1 = 3 grados de libertad, el valor 
critico es 7.82. Dado que h = 1.70 < 7.82, no puede rechazarse la hipotesis nula. 
Por lo tanto, no existe alguna razon para creer que existen diferencias entre las zonas 
cuando se comparan el precio de venta y el valor real de la propiedad. 


15.5 Prueba de Friedman para k muestras igualadas 

La prueba de rango de signos de Wilcoxon se considera como el equivalente no para¬ 
metrico del metodo t de Student para observaciones por pares o del procedimiento de 
analisis de varianza para experimentos con dos tratamientos en un diseflo en bloque 
completamente aleatorio. Cuando es necesario investigar k s* 3 tratamientos de un 
solo factor en presencia de un factor externo y por lo menos se encuentran dispo- 
nibles mediciones ordinales, un metodo no parametrico util para determinar si los 
efectos debidos a los tratamientos son los mismos, es la prueba de Friedman. 

De manera similar al procedimiento parametrico, se crea un bloque para cada 
una de las n condiciones de los factores externos de tal manera que cada bloque con- 
tiene una observation proveniente de cada uno de los k tratamientos. Ademas, se su- 
pone que los tratamientos se asignan en forma aleatoria y que no existe ninguna inte¬ 
raction entre los bloques y los tratamientos. Las nk observaciones se arreglan como 
se ilustra en la tabla 15.4, donde los bloques son los renglones y los tratamientos las 
columnas. 

La hipotesis nula para el procedimiento de Friedman es que los efectos atri- 
buidos a los tratamientos son los mismos (es decir, las problaciones de interes tienen 
distribuciones identicas) y la hipotesis alternativa es que existe una diferencia entre 
los tratamientos. Al igual que para la estadistica de Kruskal-Wallis, las diferencias 
en los tratamientos descubiertas a traves de la estadistica de Friedman implican dife¬ 
rencias en la tendencia central. 


www. FreeLibros. com 





15.5 Prueba de Friedman para k muestras igualadas 585 


TABLA 15.4 Arreglo de las observaciones para la prueba de Friedman 


Bloque 

i 

2 

Tratamiento ' 

j 

... 

W u k 

1 


Y,2 

... 

Y,j 

... 

Yu 

2 - 

Y ?' 

Y p 

... 

hj 

... 


n 

y„, 

Y„2 

... 

Ynj 

... 

Y nt 


A1 igual que en los otros procedimientos no parametricos, la prueba de Friedman 
se basa en los rangos. Para cada bloque (renglon) se asigna un rango a las observa¬ 
ciones comenzando con un rango 1 y terminando con un rango k ; entonces se suman 
los rangos para cada tratamiento. Se* R la suma de los rangos del y'-esimo trata- 
miento (column?). Si dentro de cada bloque los efectos del tratamiento son los mis- 
mos, entonces para cualquier bloque los rangos deben ser una permutacibn aleatoria 
de los enteros del 1 al k, donde cada permutacibn tiene la misma probabilidad de 
ocurrencia. De esta forma, se espera que para cada tratamiento los rangos del 1 al k 
aparezcan, en forma aproximada, con la misma frecuencia. Si los efectos de los tra- 
tamientos son identicos, R j debera tener practicamente el mismo valor para today. 
Por lo tanto, el procedimiento de Friedman determina cuando una disparidad obser- 
vada entre los Rj es suficiente para rechazar la hipbtesis nula. 

La estadistica de Friedman esta dada por 


5 = 


12 

nk(k + 1) 



- 3n(k + 1). 


(15.14) 


Las probabilidades para los vaiores de S se encuentran tabuladas para valores pe- 
quenos deny k (vease [3]). Pero si el numero de bloques n y el de tratamientos k no 
es muy pequefio (por ejemplo n s* 10 y 3= 4), la estadistica S es, en forma apro¬ 
ximada, una variable aleatoria chi-cuadrada con k - 1 grados de libertad. Al igual 
que para la prueba de Kruskal-Wallis, la regibn critica de tamano a es la porcion su¬ 
perior de la distribucion chi-cuadrada con k -1 grados de libertad. Se rechaza la hi- 
potesis nula cuando el valor de S es mayor que el valor critico. Al igual que en los ca- 
sos anteriores, los empates se manejan mediante el uso de rangos promedio. 


Ejemplo 15.5 Cuatro jueces se encargan de calificar en una competencia de salto 
que incluye a 10 finalistas. Los datos que figuran en la tabla 15.5 son las califica- 
ciones, donde un 10 indica un salto perfecto. Para a = 0.01, empleese la estadisti¬ 
ca de Friedman para determinar si existen diferencias discernibles en las califica- 
ciones que otorgan cada uno de los cuatro jueces. 

Los valores que figuran entre parentesis en la tabla 15.5 son los rangos de las ob¬ 
servaciones para cada competidor (bloque). Entonces, para cada juez, la suma de los 
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TABLA 15.5 Datos de la muestra para el ejemplo 15.5 


Competitor 

1 


2 

Juez 

, 3 



4 

1 

8.5 

(3) 

8.6 

(4) 

8.2 

(1) 

8.4 

(2) 

2 

■ 9.8 

(4) 

•9.7 

(3) 

9.4 

(1) 

9.6 

(2) 

3 

7.9 

(2) 

8.1 

(3) 

7.5 

(1) 

8.2 

(4) 

4 

9.7 

(3) 

9.8 

(4) 

9.6 (1.5) 

9.6 

(1.5) 

5 

6.2 

(1) 

6.8 

(3) 

6.9 

(4) 

6.5 

(2) 

6 

8.9 

(3) 

9.2 

(4) 

8.1 

(1) 

8.7 

(2) 

7 

9.2 (3.5) 

9.2 (3.5) 

8.7 

(1) 

8.9 

(2) 

8 

8.4 (1.5) 

8.5 

(3) 

8.4 (1.5) 

8.6 

(4) 

9 

9.2 

(2) 

9.6 

(4) 

8.9 

(1) 

9.5 

(3) 

10 

8.8 

(2) 

9.2 

(3)' 

8.6 

(1) 

9.3 

(4) 


rangos es la siguiente:./?, = 25, R 2 = 34.5, R 3 = 14, /? 4 = 26.5. El valor de la es- 
tadistica de Fiedman es 

5 = ^ u ~ [25 2 + 34.5 2 + 14 2 + 26.5 2 ] - (3)(10)(5) = 12.81. 

(10)(4)(5) 

Para a = 0.01 y Jt — ] =3 grados de libertad, el valor critico se obtiene de la tabla E 
del apendice y es igual a 11.32. Dado que s = 12.81 > 11.32, se rechaza la hipote- 
sis nula de que los efectos de los tratamientos son los mismos; las diferencias entre 
las calificaciones que otorgan los cuatro jueces son estadlsticamente discernibles. 


15.6 Coeficiente de correlation de rangos de Spearman 

En la seccion 13.8 se definio el coeficiente de correlacion de la muestra como una 
medida de la asociaci6n lineal que existe entre dos variables X y Y. El enfoque 
empleado en esa seccibn fue parametrico, ya que se supuso una distribution normal 
bivariada para X y Y. En esta seccion se define una popular medida no parametrica 
de asociacion cuando se emplean los rangos, que se conoce como coeficiente de 
correlacion de rangos de Spearman, denotado por r s . 

Sean X y Y dos caracteristicas de interes y supongase que existe una muestra 
aleatoria de n pares que consiste solo en los rangos de Xy Y. El coeficiente de corre¬ 
lacion del rango de Spearman es el coeficiente ordinario de correlacion de la muestra 
que puede determinarse mediante el empleo, ya sea de (13.27) o (13.28), excepto que 
para este caso se emplean los rangos en lugar de las observaciones de X y Y. A1 igual 
que el coeficiente de correlacion de la muestra r, el coeficiente de correlacion del ran¬ 
go r s se define en el intervalo - 1 -s r s =£ 1; y mide el grado de asociacion lineal 
entre los rangos de X y Y. Para las caracteristicas X y Y, la interpretation de r s no es 
completamente identica a la de r. Si se tienen disponibles observaciones de X y Y, 
entonces el coeficiente de correlacion de la muestra r es una medida del grado de aso¬ 
ciacion lineal que existe entre Xy Y. Pero si se emplean los rangos, r s mide la ten- 

www. FreeLibros. com 





15.6 Coejiciente ae correiacion ae ranges ae opturmun soi 


dencia de X y Y al relacionarse en forma monotona, es decir, r s se encuentra cercano 
a 1 o a -1, se sugiere una asociacion monotona creciente o decreciente para X y Y. 
En cierto sentido, r s tiene un signiflcado mayor que el de r debido a que al medir el 
grado de asociacion monotona entre X y Y, r s no se encuentra restringido a des- 
cubrir solo una asociacion lineal entre estas. 

Sea (X' it T t ), i = 1, 2, n la representacibn de una muestra de rangos de X 
y Y. Entonces, de (13.28) el coeficiente de fcorrelacibn de rangos de Spearman es 



Si no existen empates puede desarrollarse una relacion alternativa mas simple 
para (15.15) al tomar ventajas de la naturaleza del rango. Los rangos (X-, Y ’) son 
arreglos de los primeros n enteros positivos. Dado que la suma de los primeros n ente- 
ros positivos es n(n 4- l)/2, y la suma de sus cuadrados es n(n + l)(2/i + l)/6, 

2 x; = 2 v; =«(«+ d /2 05.i6) 

y 

2 A,' 2 =^Y; 2 = n(n + 1)(2 n + l)/6. (15.17) 

Ademas, dado que la relacion 


2 x;y\ = [ 2 x; 2 + 2 y; 2 - 2 (X - m 2 ]/ 2 (i5.i8) 

es valida para cualquier valor, al sustituir (15.16) a (15.18) en (15.15) y despues de al- 
gunos manejos algebraicos, se obtiene la expresion alternativa 


62(a; - y;) 2 

n{n 2 - 1) 


(15.19) 


Ejemplo 15.6 Se pide a dos catadores de vinos que clasifiquen 10 vinos tintos ligeros 
en una escala del 1 (pobre) al 10 (excelente). Se obtienen los resultados que se mues- 
tran en la tabla 15.6. Calculese el coeficiente de correiacion de rangos de Spearman. 

Dado que no existen empates, puede usarse (15.19) para calcular r s . 


6[(5 - 3) 2 + (2 - 4) 2 + - + (3 - l) 2 ] 
10(100 - 1 ) 


0.73, 


lo cual sugiere una fuerte concordancia entre los dos catadores. 
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TABLA 15.6 Datos de la muestra para el ejemplo 15.6 


Vino 

Catador 1 

X' y , 

Catador 2 

Y' 

1 

5 

3 

2, 

2 

4 

3 

8 

7 

4 

9 

6 

5 

10 

9 

6 

7 

9 

7 

1 

3 

8 

4 

6 

9 

4 

7 

10 

3 

1 



15.7 Comentarios finales 

Para los metodos presentados en este capitulo, se tienen tres ventajas: 

1. Las suposiciones para su empleo son menos estrictas que las de los correspon- 
dientes metodos parametricos. 

2. Los metodos no parametricos pueden aplicarse en forma muy facil a todas 
aquellas observaciones que se definen sobre una escala ordinal. 

3. Los calculos por efectuar son m&s faciles cuando se comparan con los de los 
correspondientes metodos parametricos. 

A causa de la primera ventaja, los metodos parametricos son particularmente 
utiles cuando se tienen muestras de tamafto pequefio y existe interes en adherirse a 
las suposiciones de distribucion para los metodos parametricos. En particular, las 
pruebas de Mann-Whitney, Wilcoxon, Kruskal-Wallis y de Friedman se comparan, 
en potencia, a las de los correspondientes metodos parametricos, lo que incluye a la 
distribucion t de Student o a la estadistica Fen el analisis de varianza, pero como ya 
se indico en el capitulo 9, para muestras de tarnano mayor de 15, la distribucion t de 
Student es bastante mas robusta con respecto a la suposicion de normalidad. Ademas, 
la estadistica T es robusta con respecto a la suposicion de varianzas iguales para 
muestras de gran tamafto y con el mismo numero de observaciones, cuando se com¬ 
paran dos medias, de la misma manera en que la estadistica F lo es en el analisis de 
varianza, siempre y cuando los tamafios de la muestra de los tratamientos sean los 
mismos. De esta forma, cuando se tienen muestras de gran tamafto y las observa¬ 
ciones contenidas en estas se definen por lo menos sobre una escala ordinal, puede 
perderse information muy importante al convertir las observaciones en rangos y sig- 
nos y utilizar metodos no parametricos. Para tales casos, la eficiencia en potencia de 
los metodos no parametricos es menor que la de los procedimientos parametricos. 
Por lo tanto, la ventaja mas clara que tienen los metodos no parametricos sobre los 
de tipo parametrico es la segunda que se encuentra en la lista mencionada con ante- 
rioridad. La aplicacion de los metodos parametricos a observaciones que se en- 
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cuentran definidas s61o sobre una escala ordinal es muy dificil, ya que la interpreta- 
ci6n de un intervalo en este caso tiene poco significado. 

Referencias 

\ \ 

1. J.-D. Gibbons, Nonparametric statistical inference, McGraw-Hill, New York, 1971. 

2. M. Hollander and D. A. Wolfe, Nonparametric statistical methods, Wiley, New York, 
1973. 

3. S. Siegel, Nonparametric statistics for the behavioral sciences, McGraw-Hill, New 
York, 1956. 


Ejercicios 

15.1. Para los datos del ejemplo 15.1, pruebese la hipotesis nula de que no existe diferencia 
entre las medias mediante el empleo del procedimiento t de Student de la section 9.6.2. 
Para el mismo tamafto del error de tipo 1 dado en este ejemplo, it s diferente la conclu¬ 
sion? 

15.2. Durante cinco aftos se llevd a cabo un estudio para determinar si existe alguna diferen¬ 
cia en el numero de resfriados que sufren los fumadores y los no fumadores. Con base 
en muestras aleatorias de 14 no fumadores y 12 fumadores se observaron, a lo largo de 
los cinco afios, los siguientes datos. 


No fumadores 

1 0 2 

7 

3 

1 2 2 

4 3 5 0 

2 1 

Fumadores 

4 2 6 

5 

8 

10 8 7 

6 4 9 3 



Usese la estadistica U de Mann-Whitney para determinar si existe alguna raz6n para 
creer que estas muestras aleatorias provienen de poblaciones con diferentes distribu- 
ciones. Supongase que a = 0.05. ^Existen algunas suposiciones que se esten violando? 

15.3. Una compania de mercadotecnia se interesa en comparar la aceptacion por parte del 
consumidor de dos nuevos productos, A y B. Se seleccionaron, en forma aleatoria, 12 
consumidores y se les pidio que dieran su opinion, con respecto al producto A, sobre 
una escala de 1 (Poca aceptacion) a 5 (mucha aceptacion). Se hizo lo mismo para el 
producto B, empleando para ello el mismo numero de consumidores. Seobtuvicron los 
siguientes datos: 


Producto A 

1 

2 

5 

5 

4 

3 

5 

4 4 

3 

5 

2 

Producto B 1 

2 

2 

i 

1 

3 

1 


2 4 

3 

1 

3 


Mediante el empleo de la estadistica U de Mann-Whitney, determinese si puede recha- 
zarse, con a = 0.05 la hipotesis nula de que estas muestras aleatorias provienen de 
poblaciones con distribuciones identicas. 

15.4. La siguiente information representa el numero de unidades terminadas para dos traba- 
jadores, A y B, en un periodo de cinco dias. 


A 

* i 

49 

52 

53 

47 

50 

B 

56 

48 

58 

46 

55 
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a) Mediante el uso de la expresidn (15.7), obtengase la funcidn de probabilidad para el 
numero de tendencias posible. 

b) Para a = 0.05, empleese el procedimiento de tendencias de Wald-Wolfowitz para 
probar la hipdtesis nula de que estas muestras provienen de distribuciones idfinticas. 

15.5. El procedimiento de tendencias de Wald-Wolfowitz se emplea muchas veces para pro¬ 
bar la aleatoriedad de una secuencia dada de observaciones. Si la aleatoriedad existe, 
entOnces el numero de tendencias para dos grupos distintos no debera ser ni muy gran¬ 
de ni muy pequefio. Supongase que los siguientes datos constituyen la secuencia de 
residuos para una ecuacidn de regresion estimada: 


-2.98 

-4.19 

-0.51 

5.19 

2.38 

6.73 

0.93 

1.29 

-3.18 

-1.14 

-0.54 

-2.76 

-1.89 

-4.28 

-0.18 

0.32 

0.48 

1.48 

-2.43 

-4.69 

3.18 

0.64 

0.89 

2.08 

0.98 

-3.28 



iExiste alguna raz6n para creer que esta secuencia de residuos no es aleatoria? Usese 
a = 0.05. 

15.6. Una compaflia de mercadotecnia se interesa en la preferencia del consumidor con res- 
pecto a dos marcas de refresco que compiten entre si. Se seleccionan, en forma aleato¬ 
ria, 14 personas y se les pide que clasifiquen las bebidas mediante una escala del 1 
(poca aceptacion) al 10 (mucha aceptacion). El orden en la seleccion de la bebida fue 
aleatorio. Se obtiene la siguiente informacion: 


Persona 

/ 

2 

3 

4 

5 

6 

7 

8 

9 

10 

II 

12 

13 

14 

Marca A 

7 

5 

9 

4 

8 

10 

4 

3 

7 

2 

8 

6 

6 

9 

Marca B 

3 

2 

7 

6 

9 

3 

5 

1 

4 

2 

4 

7 

5 

4 


Mediante el uso de la prueba del signo, £se tiene alguna razon para creer que existe una 
diferencia en la preferencia para estos dos refrescos? Supongase a = 0.1. 

15.7. Para los datos que figuran en el ejercicio 15.6, empleese la prueba de rangos de signos 
de Wilcoxon. <,Se obtienen las mismas conclusiones? 

15.8. Para los datos del ejemplo 9.10, supongase que no puede formularse la suposicion de 
normalidad. Mediante el empleo de la prueba de rangos de signos de Wilcoxon, 
determinese si puede rechazarse la correspondiente hipotesis nula no parametrica para 
un nivel a = 0.01 

15.9. Durante 12 dias seleccionados al azar, dos tiendas, A y B vendieron el siguiente nume¬ 
ro de unidades del mismo producto: 


Dia 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

a 

12 

A 

42 

58 

47 

39 

41 

56 

59 

37 

38 

46 

43 

51 

B 

64 

57 

48 

59 

64 

52 

65 

59 

37 

65 

68 

49 


Mediante el empleo de la prueba del signo, ipuede rechazarse la hipotesis nula de que 
las muestras provienen de distribuciones identicas para un nivel a = 0.05? 

15.10. Para los datos que figuran en el ejercicio 15.9, us'ese la prueba de rangos de signos de 
Wilcoxon y comparense los resultados. 

15.11. Se desea determinar si el campo de especializacion del estudiante no graduado tiene al- 
gun efecto sobre su desempeno en una escuela de leyes. Se toma una muestra aleatoria 
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TABLA 15.7 Datos de la muestra para d ejemplo 15.11 ■>. .* 


Finanzas 

Ciencia o , 

‘ r.., -7 yaH-ST-iO* 

-- ‘"■■T 

p;n3«'ns3biiJ 

ingenierla 

Arles liberates 

Otros 


‘ '3 

1 '*•*••• •• - .. i. i 

.i 3 

9 

2 

( , ' 4 

34 

22 

7 

4 

24 

10 

■ \ 15 

- . 48 ; 

31 

18 

26 

r 52 , 

47 

23 

38 

59 

65 

25 

43 

63 



45 

67 



49 

72 



55 

79 


de 30 estudiantes de una clase de graduados de cierta escuela de leyes, la cual clasifica a 
los estudiantes y anota su campo de especializacion; los datos que se encuentran en la 
tabla 15.7 son los resultados de este procedimiento. Mediante el empleo de la prueba 
de Kruskal-Wallis, determinese si el campo de especializacion tiene algun efecto sobre 
el desempeno en la escuela de leyes, con a = 0.05. 

15.12. Con referencia a los datos que se encuentran en el ejercicio 12.7, empleese el procedi¬ 
miento de Kruskal-Wallis para probar la hipdtesis nula de que no existe ninguna dife- 
rencia con respecto a la durabilidad entre las dos marcas con a = 0.05. La conclu¬ 
sion, £es la misma que la que se obtuvo para el ejercicio 12.7? 

15.13. Se seleccionaron 12 estudiantes al azar, de una clase muy grande; sus calificaciones, en 
los cuatro ex&menes que se Ilevaron a cabo durante el trimestre, se encuentran en la 
tabla 15.8. Mediante el uso de la prueba de Friedman, determinese si las diferencias 
entre los cuatro examenes son estadisticamente discernibles para un nivel a = 0.01. 
iSe estaria de acuerdo con la hipotesis de que no existe interaction alguna entre los es¬ 
tudiantes? Comentese. 


TABLA 15.8 Datos de la muestra para el ejercicio 15.13 


Esludiante 

1 

2 

3 

4 

1 

72 

68 

80 

75 

2 

89 

87 

78 

92 

3 

48 

56 

64 

58 

4 

65 

76 

70 

62 

5 

86 

94 

93 

85 

6 

56 

73 

78 

87 

7 

75 

84 

65 

69 

8 

39 

45 

48 

56 

9 

78 

67 

69 

59 

10 

98 

87 

86 

95 

11 

64 

87 

92 

48 

12 

82 

76 

85 

79 
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15.14. Con referenda a los datos del ejerririo 12.6, tisese el procedimiento de Friedman para 
determinar si las diferencias que existen entre los cuatro supermercados son 
estadisticamente discemibles para un nivel cr = 0.01. 

. 1 ■' ■>' ' 'f ‘ 

15.15. Para el ejercido 13.12, conviertanse los datos en rangos y calcdlese el coefidente de 
correlacidn de rangos de Spearman. 

15.16. Dos jueces se encargan de calificar a ocho patinadores que patinan sobre hielo, me- 
diante el empleo de una escala del 1 (muy malo) al 10 (el mejor). Se obtienen los si- 
guiente resultados. 


Patinador 

1 

2 

3 

4 

5 

6 

7 

8 

Juez 1 

3 

4 

8 

8 

4 

6 

4 

7 

Juez 2 

2 

4 

9 

7 

. 2 

8 

1 

9 


Calculese el coeficiente de correlation de rangos de Spearman y formulese un comenta- 
rio con respecto a si existe una relacibn que sea eviJen... 

15.17. Mediante el empleo de la misma escala que se menciona en el ejercicio 15.16, dos jueces 
califican el talento de las 10 semifinalistas del concurso seftorita America. Se tienen los 
siguientes resultados: 


Semifina/ista 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

J uez 1 

2 

6 

5 

9 

3 

7 

9 

2 

6 

2 

Juez 2 

7 

1 

4 

4 

8 

9 

3 

9 

10 

8 


Calculese el coefidente de correlation de rangos de Spearman y formulese un comenta- 
rio con respecto a si existe alguna relation que sea evidente. 

15.18. Un grupo de analistas de inversion clasificaron 10 compaflias de acuerdo con su creci- 
miento potencial y el valor de sus acciones de la siguiente manera: 


CompafUa 

/ 

2 

3 

4 

5 

6 

7 

8 

9 

10 

Valores en librosi 

8 

3 

10 

1 

6 

2 

5 

7 

4 

9 

Crecimiento 

4 

8 

6 

5 

9 

3 

7 

1 

10 

2 


Calculese el coeficiente de correlation de rangos de Spearman y formulese un comenta- 
rio con respecto a si existe una relation, que sea evidente, entre el valor de las acciones 
de la compania y su crecimiento potencial. 
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TABLA B 
TABLA C 

TABLA D 
TABLA E 
TABLA F 
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TABLA J 
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Valores de la fruition de distribution acumulativa binomial 
Valores de la fruition de distribution acumulativa de Poisson 
Valores de las funciones de probabilidad y distribution acumulativa 
para la distribution hipergeometrica 

Valores de la funcion de distribution acumulativa normal estandar 
Valores de cuantiles de la distribution chi-cuadrada 
Valores de cuantiles de la distribution t de Student 
Valores de cuantiles de la distribution F 

A:-valores para los limites de tolerancia bilaterales cuando se muestrean 
distribuciones normales 

A:-valores para los limites de tolerancia unilaterales cuando se mues¬ 
trean distribuciones normales 

Valores de cuantiles superiores de la distribution de la estadistica £>„ 

de Kolmogorov-Smirnov 

Limites de la estadistica de Durbin-Watson 
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594 Apendice: Tabla A 
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.0000 1.0000 1.0000 0.9999 0.9994 0.9972 0.9905 0.9745 0.9427 0.8883 0.8062 

.0000 1.0000 1.0000 1.0000 0.9999 0.9996 0.9983 0.9944 0.9847 0.9644 0.9270 

.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9992 0.9972 0.9921 0.9807 

•0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9989 0.9968 

.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 
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TABLA B Valores de la funcion de distribution acumulativa de Poisson 
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0.1225 0.1108 0.1003 0.0907 0.0821 0.0743 0.0672 0.0608 0.0550 0.0498 
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1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9999 0.9999 0.9999 

1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1 0000 1.0000 


“9.0 
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TABLA C Valores de las funciones de probabilidad y distribution acumulativa para la distribution hipergeometrica 
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1.000000 0.100000 6 5 4 3 0.666667 0.666667 

0.400000 0.400000 6 5 4 4 1.000000 0.333333 

1.000000 0.600000 6554 0.833333 0.833333 
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Fuente: Tornado de Tables of the hypergeometric probability distribution, por Gerald J. Liebcrman y Donald B. Owen, con permiso de los editores, 
Stanford University Press. Copyright© 1961 by the Board of Trustees of the Leland Stanford Junior University. 
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0.7580 0.7611 0.7642 0.7673 0.7703 0.7734 0.7764 0.7794 0.7823 0.7852 

0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133 

0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389 
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TABLA F Valores de cuantiles de la distribution t de Student 
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12 

-3.930 

-3.055 

-2.681 

-2.179 

- 1.782 

-1.356 

-0.873 

13 

-3.852 

-3.012 

-2.650 

-2.160 

-1.771 

-1.350 

-0.870 

14 

-3.787 

-2.977 

-2.624 

-2.145 

-1.761 

-1.345 

-0.868 

15 

-3.733 

-2.947 

-2.602 

-2.131 

-1.753 

-1.341 

-0.866 

16 

-3.686 

-2.921 

-2.583 

-2.120 

-1.746 

-1.337 

-0.865 

17 

-3.646 

-2.898 

-2.567 

-2.110 

-1.740 

-1.333 

-0.863 

18 

-3.610 

-2.878 

-2.552 

-2.101 

-1.734 

-1.330 

-0.862 

19 

-3.579 

-2.861 

-2.539 

-2.093 

-1.729 

-1.328 

-0.861 

20 

-3.552 

-2.845 

-2.528 

-2.086 

-1.725 

-1.325 

-0.860 

21 

-3.527 

-2.831 

-2.518 

-2.080 

-1.721 

-1.323 

-0.859 

22 

- 3.505 

-2.819 

-2.508 

-2.074 

-1.717 

-1.321 

-0.858 

23 

-3.485 

-2.807 

-2.500 

-2.069 

-1.714 

-1.319 

-0.858 

24 

-3.467 

- 2.797 

-2.492 

-2.064 

- 1.711 

-1.318 

-0.857 

25 

-3.450 

-2.787 

-2.485 

-2.060 

-1.708 

-1.316 

-0.856 

26 

-3.435 

-2.779 

-2.479 

-2.056 

-1.706 

-1.315 

-0.856 

27 

-3.421 

-2.771 

-2.473 

- 2.052 

-1.703 

-1.314 

-0.855 

28 

-3.408 

-2.763 

-2.467 

-2.048 

-1.701 

-1.313 

-0.855 

29 

-3.396 

-2.756 

-2.462 

-2.045 

-1.699 

-1.311 

-0.854 

30 

-3.385 

-2.750 

-2.457 

-2.042 

-1.697 

-1.310 

-0.854 

35 

-3.340 

-2.724 

-2.438 

-2.030 

-1.690 

-1.306 

-0.852 

40 

-3.307 

-2.704 

-2.423 

-2.021 

-1.684 

-1.303 

-0.851 

45 

-3.281 

-2.690 

-2.412 

-2.014 

-1.679 

- 1.301 

-0.850 

50 

-3.261 

-2.678 

-2.403 

-2.009 

-1.676 

-1.299 

-0.849 

60 

-3.232 

-2.660 

-2.390 

-2.000 

-1.671 

-1.2% 

-0.848 

70 

-3.211 

-2.648 

-2.381 

-1.994 

- 1.667 

-1.294 

-0.847 

80 

-3.195 

-2.639 

-2.374 

-1.990 

- 1.664 

-1.292 

-0.846 

90 

-3.183 

-2.632 

-2.369 

- 1.987 

— 1.662 

-1.291 

-0.846 

100 

-3.174 

-2.626 

-2.364 

-1.984 

-1.660 

-1.290 

-0.845 

200 

-3.131 

-2.601 

-2.345 

-1.972 

-1.652 

-1.286 

-0.843 

500 

-3.107 

-2.586 

-2.334 

-l.%5 

-1.648 

-1.283 

-0.842 

1000 

-3.098 

-2.581 

-2.330 

-1.%2 

- 1.646 

-1.282 

-0.842 
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622 Aptndice: Tabla F 


TABLA F (conUnuacion) Valoresde cuantiles de la distribution t de Student 


V 

4.800 1 

4.900 

4.950 

4.975 

4.990 

4.995 

4.999 

1 

1.376 

3.078 

6.314 „ 

.... 12.706 


63.656 

318.294 

2 

1.061 

1.886 

2.920 

.4.303 

6.%5 

9.925 

22.327 

3 

0.978 

1.638 

2.353 

3.182 

4.541 

5.841 


4 

0.941 

1.533 

2.132 

2.776 

3.747 


.7.173 

5 

0.920 

1.476 

2.015 

2.571 

3.365 


5.893 

6 

0.906 

1.440 

1.943 

2.447 

3.143 

mmm "si 


7 

0.896 

1.415 

1.895 

2.365 

2.998 

3.499 

4.785 

8 

0.889 

1.397 

1.860 

2.306 

2 .8% 

3.355 


9 

0.883 

1.383 

1.833 

' 2.262 

2.821 


4.297 

10 

0.879 

1.372 

1.812 

2.228 

2.764 


4.144 

11 

0.876 

1.363 

1.7% 

2.201 

2.718 

3.106 

4.025 

12 

0.873 

1!356 

1.782 

2.179 

2.681 

mtMM 

3.930 

13 

0.870 

1.350 

1.771 

2.160 


1Bfffl 

3.852 

14 

0.868 

1.345 

1.761 

2.145 

2.624 

2.977 

3.787 

15 

0.866 

1.341 

1.753 

2.131 


2.947 

3.733 

16 

0.865 

1.337 

1.746 

2.120 

2.583 

2.921 

3.686 

17 

0.863 

1.333 

1.740 

2.110 

2.567 

2.898 

3.646 

18 

0.862 

1.330 

1.734 

2.101 

2.552 

2.878 


19 

0.861 

1.328 

1.729 

2.093 

2.539 

2.861 

3.579 

20 

0.860 

1.325 

1.725 

2.086 

2.528 

2.845 

3.552 

21 

0.859 

1.323 

1.721 

2.080 

2.518 


3.527 

22 

0.858 

1.321 

1.717 

2.074 


2.819 


23 

; 0.858 

1.319 

1.714 

2.069 


2.807 

3.485 

24 

0.857 

1.318 

1.711 

2.064 

2.492 

2.797 


25 

0.856 

1.316 

1.708 

2.060 

2.485 

2.787 


26 

0.856 

1.315 

1.706 

2.056 


2.779 

3.435 

27 

0.855 

1.314 

1.703 

2.052 

2.473 

2.771 

3.421 

28 

0.855 

1.313 

1.701 

2.048 

2.467 



29 

0.854 

1.311 

1.699 

2.045 

2.462 

2.756 

3.396 

30 

0.854 

1.310 

1.697 

2.042 

2.457 


3.385 

35 

0.852 

1.306 

1.690 

2.030 

2.438 

2.724 


40 

0.851 

1.303 

1.684 

2.021 

2.423 

2.704 

3.307 

45 

0.850 

1.301 

1.679 

2.014 

2.412 


3.281 

50 

0.849 

1.299 

1.676 

2.009 


2.678 

3.261 

60 

0.848 

1.296 

1.671 

2.000 



3.232 

70 

0.847 

1.294 

1.667 

1.994 

2.381 

2.648 

3.211 

80 

0.846 

1.292 

1.664 

1.990 

2.374 

2.639 

3.195 

90 

0.846 

1.291 

1.662 

1.987 

2.368 


3.183 

100 

0.845 

1.290 

1.660 

1.984 

2.364 

2.626 

3.174 

200 

0.843 

1.286 

1.652 

1.972 

2.345 

2.601 

3.131 

500 

0.842 

1.283 

1.648 

1.965 

2.334 

2.586 

3.107 

1000 

0.842 

1.282 

1.646 

1.962 


2.581 
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i «*wn» w 



v ] - grados de libertad del numerador 



1 39.86 49.50 53.59 55.83 57.24 58.20 58.91 59.44 59.86 60.19 

2 8.53 9.00 9.16 9.24 9.29 9.33 9.35 9.37 9.38 9.39 

3 5.54 5.46 5.39 5.34 5.J1 5.28 5.27 5.25 5.24 5.23 

4 4.54 4.32 4.19 4.11 4.05 4.01 3.98 3.95 3.94 3.92 

5 4.06 3.78 3.62 3.52 3.45 3.40 3.37 3.34 3.32 3.30 

6 3.78 3.46 3.29 3.18 3.11 3.05 3.01 2.98 2.% 2.94 

7 3.59 3.26 3.07 2.96 2.88 2.83 2.79 2.75 2.72 2.70 

8 3.46 3.11 2.92 2.81 2.73 2.67 2.62 2.59 2.56 2.54 

9 3.36 3.01 2.81 2.69 2.61 2.55 2.51 2.47 2.44 2.42 

10 3.29 2.92 2.73 2.61 2.52 2.46 2.41 2.38 2.35 2.32 

11 3.23 2.86 2.66 2.54 2.45 2.39 2.34 2.30 2.27 2.25 

12 3.18 2.81 2.61 2.48 2.39 2.33 2.28 2.24 2.21 2.19 

13 3.14 2.76 2.56 2.43 2.35 2.28 2.23 2.20 2.16 2.14 

14 3.10 2.73 2.52 2.39 2.31 2.24 2.19 2.15 2.12 2.10 

15 3.07 2.70 2.49 2.36 2.27 2.21 2.16 2.12 2.09 2.06 

16 3.05 2.67 2.46 2.33 2.24 2.18 2.13 2.09 2.06 2.03 

17 3.03 2.64 2.44 2.31 2.22 2.15 2.10 2.06 2.03 2.00 

18 3.01 2.62 2.42 2.29 2.20 2.13 2.08 2.04 2.00 1.98 

19 2.99 2.61 2.40 2.27 2.18 2.11 2.06 2.02 1.98 1.96 

20 2.97 2.59 2.38 2.25 2.16 2.09 2.04 2.00 1.96 1.94 

21 2.96 2.57 2.36 2.23 2.14 2.08 2.02 1.98 1.95 1.92 

22 2.95 2.56 2.35 2.22 2.13 2.06 2.01 1.97 1.93 1.90 

23 2.94 2.55 2.34 2.21 2.11 2.05 1.99 1.95 1.92 1.89 

24 2.93 2.54 2.33 2.19 2.10 2.04 1.98 1.94 1.91 1.88 

25 2.92 2.53 2.32 2.18 2.09 2.02 1.97 1.93 1.89 1.87 

26 2.91 2.52 2.31 2.17 2.08 2.01 1.96 1.92 1.88 1.86 

27 2.90 2.51 2.30 2.17 2.07 2.00 1.95 1.91 1.87 1.85 

28 2.89 2.50 2.29 2.16 2.06 2.00 1.94 1.90 1.87 1.84 

29 2.89 2.50 2.28 2.15 2.06 1.99 1.93 1.89 1-86 1.83 

30 2.88 2.49 2.28 2.14 2.05 1.98 1.93 1.88 1.85 1.82 

35 2.85 2.46 2.25 2.11 2.02 1.95 1.90 1.85 1.82 1.79 

40 2.84 2.44 2.23 2.09 2.00 1.93 1.87 1.83 1 79 1.76 

50 2.81 2.41 2.20 2.06 1.97 1.90 1.84 1.80 1.76 1.73 

60 2.79 2.39 2.18 2.04 1.95 1.87 1.82 1.77 1.74 1.71 

80 2.77 2.37 2.15 2.02 1.92 1.85 1.79 1.75 1.71 1-68 

100 2.76 2.36 2.14 2.00 1.91 1.83 1.78 1.73 1 69 1 66 

200 2.73 2.33 2.11 1.97 1.88 1.80 1.75 1.70 1.66 1-63 

500 2.72 2.31 2.09 1.96 1.86 1.79 1.73 1.68 1.64 1.6 

1000 2.71 2.31 2.09 1.95 1.85 1.78 1.72 1.68 1-64 1-61 
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624 Apindke : Tabla G 


TABLA G (condnuad6n) Valores de cuantiles de la distribuci 6 n F 

i -« = 0.9 


v t = grados de libertad del numerador 


•'J 

11 

12 

15 

20 

25 

, i 30 

40 

50 

100 

1000 

1 

60.47 

60.71 

61.22 

61.74 

62106 

62.26 

62.53 

62.69 

63.00 

63.29 

2 

9.40 

9.41 

9.42 

9.44 

9.45 

9.46 

9.47 

9.47 

9.48 

9.49 

3 

5.22 

5.22 

5.20 

5.19 

5.17 

5.17 

5.16 

5.15 

5.14 

5.13 

4 

3.91 

3.90 

3.87 

3.84 

3.83 

3.82 

3.80 

3.80 

3.78 

3.76 

5 

3.28 

3.27 

3.24 

3.21 

3.19 

3.17 

3.16 

3.15 

3.13 

3.11 

6 

2.92 

2.90 

2.87 

2.84 

2.81 

2.80 

2.78 

2.77 

2.75 

2.72 

7 

2.68 

2.67 

2.63 

2.59 

2.57 

2.56 

2.54 

2.52 

2.50 

2.47 

8 

2.52 

2.50 

2.46 

2.42 

2.40 

2.38 

2.36 

2.35 

2.32 

2.30 

9 

2.40 

2.38 

2.34 

2.30 

2.27 

2.25 ' 

2.23 

2.22 

2.19 

2.16 

10 

2.30 

2.28 

2.24 

2.20 

2.17 

2.16 

2.13 

2.12 

2.09 

2.06 

11 

2.23 

2.21 

2.17 

2.12 

2 10 

2.08 

2.05 

2.04 

2.00 

1.98 

12 

2.17 

2.15 

2.10 

2.06 

2.03 

2.01 

1.99 

1.97 

1.94 

1.91 

13 

2.12 

2.10 

2.05 

2.01 

1.98 

1.96 

1.93 

1.92 

1.88 

1.85 

14 

2.07 

2.05 

2.01 

1.96 

1.93 

1.91 

1.89 

1.87 

1.83 

1.80 

15 

2.04 

2.02 

1.97 

1.92 

1.89 

1.87 

1.85 

1.83 

1.79 

1.76 

16 

2.01 

1.99 

1.94 

1.89 

1.86 

1.84 

1.81 

1.79 

1.76 

1.72 

17 

1.98 

1.96 

1.91 

1.86 

1.83 

1.81 

1.78 

1.76 

1.73 

1.69 

18 

1.95 

1.93 

1.89 

1.84 

1.80 

1.78 

1.75 

1.74 

1.70 

1.66 

19 

, 1.93 

1.91 

1.86 

1.81 

1.78 

1.76 

1.73 

1.71 

1.67 

1.64 

20 

1.91 

1.89 

1.84 

1.79 

1.76 

1.74 

1.71 

1.69 

1.65 

1.61 

21 

1.90 

1.87 

1.83 

1.78 

1.74 

1.72 

1.69 

1.67 

1.63 

1.59 

22 

1.88 

1.86 

1.81 

1.76 

1.73 

1.70 

1.67 

1.65 

1.61 

1.57 

23 

1.87 

1.84 

1.80 

1.74 

1.71 

1.69 

1.66 

1.64 

1.59 

1.55 

24 

1.85 

1.83 

1.78 

1.73 

1.70 

1.67 

1.64 

1.62 

1.58 

1.54 

25 

1.84 

1.82 

1.77 

1.72 

1.68 

1.66 

1.63 

1.61 

1.56 

1.52 

26 

1.83 

1.81 

1.76 

1.71 

1.67 

1.65 

1.61 

1.59 

1.55 

1.51 

27 

1.82 

1.80 

1.75 

1.70 

1.66 

1.64 

1.60 

1.58 

1.54 

1.50 

28 

1.81 

1.79 

1.74 

1.69 

1.65 

1.63 

1.59 

1.57 

1.53 

1.48 

29 

1.80 

1.78 

1.73 

1.68 

1.64 

1.62 

1.58 

1.56 

1.52 

1.47 

30 

1.79 

1,77 

1.72 

1.67 

1.63 

1.61 

1.57 

1.55 

1.51 

1.46 

35 

1.76 

1.74 

1.69 

1.63 

1.60 

1.57 

1.53 

1.51 

1.47 

1.42 

40 

1.74 

1.71 

1.66 

1.61 

1.57 

1.54 

1.51 

1.48 

1.43 

1.38 

50 

1.70 

1.68 

1.63 

1.57 

1.53 

1.50 

1.46 

1.44 

1.39 

1.33 

60 

1.68 

1.66 

1.60 

1.54 

1.50 

1.48 

1.44 

1.41 

1.36 

1.30 

80 

1.65 

1.63 

1.57 

1.51 

1.47 

1.44 

1.40 

1.38 

1.32 

1.25 

100 

1.64 

1.61 

1.56 

1.49 

1.45 

1.42 

1.38 

1.35 

1.29 

1.22 

200 

1.60 

1.58 

1.52 

1.46 

1.41 

1.38 

1.34 

1.31 

1.24 

1.16 

500 

1.58 

1.56 

1.50 

1.44 

1.39 

1.36 

1.31 

1.28 

1.21 

1.11 

1000 

1.58 

1.55 

1 49 

1.43 

1.38 

1.35 

1.30 

1.27 

1.20 

1.08 
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Ap & ndke : Tabla G 625 


TAB LA G (continnacidn) Valorcs de cuantilcs de la distribution F 






1 

— a * 

0.95 








v , = 

gradofde libertad 'del mimerador 




Vi 

1 

2 

3 

4 

5 ^ 

6 

7 ■ 

8 ' ? 

9 ' 

10 

1 

161.45 

199.50 

215.71 

224.58 

230.16 

233.99 

236.77 

238 . 88 - 

240.54 

241.88 

2 

18.51 

19.00 

19.16 

19.25 

19.30 

19.33 

19.35 

19.37 

19.38 

19.40 

3 

10.13 

9.55 

9.28 

9.12 

9.01 

8.94 

8.89 

8.85 

8.81 

8.79 

4 

7.71 

6.94 

6.59 

6.39 

6.26 

6.16 

6.09 

6.04 

6.00 

5.97 

5 

6.61 

5.79 

5.41 

5.19 

5.05 

4.95 

4.88 

4.82 

4.77 

4.73 

6 

5.99 

5.14 

4.76 

4.53 

4.39 

4.28 

4.21 

4.15 

4.10 

4.06 

7 

5.59 

4.74 

4.35 

4.12 

3.97 

3.87 

3.79 

3.73 

3.68 

3.64 

8 

5.32 

4.46 

4.07 

3.84 

3.69 

3.58 

3.50 

3.44 

3.39 

3.35 

9 

5.12 

4.26 

3.86 

3.63 

3.48 

3.37 

3.29 

3.23 

3.18 

3.14 

10 

4 .% 

4.10 

3.71 

3.48 

3.33 

3.22 

3.14 

3.07 

3.02 

2.98 

11 

4.84 

3.98 

3.59 

3.36 

3.20 

3.09 

3.01 

2.95 

2.90 

2.85 

12 

4.75 

3.89 

3.49 

3.26 

3.11 

3.00 

2.91 

2.85 

2.80 

2.75 

13 

4.67 

3.81 

3.41 

3.18 

3.03 

2.92 

2.83 

2.77 

2.7 i 

2.67 

14 

4.60 

3.74 

3 A 4 

3.11 

2.96 

2.85 

2.76 

2.70 

2.65 

2.60 

15 

4.54 

3.68 

3.29 

3.06 

2.90 

2.79 

2.71 

2.64 

2.59 

2.54 

16 

4.49 

3.63 

3.24 

3.01 

2.85 

2.74 

2.66 

2.59 

2.54 

2.49 

17 

4.45 

3.59 

3.20 

2 .% 

2.81 

2.70 

2.61 

2.55 

2.49 

2.45 

18 

4.41 

3.55 

3.16 

2.93 

2.77 

2.66 

2.58 

2.51 

2.46 

2.41 

19 

4.38 

3.52 

3.13 

2.90 

2.74 

2.63 

2.54 

2.48 

2.42 

2.38 

20 

4.35 

3.49 

3.10 

2.87 

2.71 

2.60 

2.51 

2.45 

2.39 

2.35 

21 

4.32 

3.47 

3.07 

2.84 

2.68 

2.57 

2.49 

2.42 

2.37 

2.32 

22 

4.30 

3.44 

3.05 

2.82 

2.66 

2.55 

2.46 

2.40 

2.34 

2.30 

23 

4.28 

3.42 

3.03 

2.80 

2.64 

2.53 

2.44 

2.37 

2.32 

2.27 

24 

4.26 

3.40 

3.01 

2.78 

2.62 

2.51 

2.42 

2.36 

2.30 

2.25 

25 

4.24 

3.39 

2.99 

2.76 

2.60 

2.49 

2.40 

2.34 

2.28 

2.24 

26 

4.23 

3.37 

2.98 

2.74 

2.59 

2.47 

2.39 

2.32 

2.27 

2.22 

27 

4.21 

3.35 

2 .% 

2.73 

2.57 

2.46 

2.37 

2.31 

2.25 

2.20 

28 

4.20 

3.34 

2.95 

2.71 

2.56 

2.45 

2.36 

2.29 

2.24 

2.19 

29 

4.18 

3.33 

2.93 

2.70 

2.55 

2.43 

2.35 

2.28 

2.22 

2.18 

30 

4.17 

3.32 

2.92 

2.69 

2.53 

2.42 

2.33 

2.27 

2.21 

2.16 

35 

4.12 

3.27 

2.87 

2.64 

2.49 

2.37 

2.29 

2.22 

2.16 

2.11 

40 

4.08 

3.23 

2.84 

2.61 

2.45 

2.34 

2.25 

2.18 

2.12 

2.08 

50 

4.03 

3.18 

2.79 

2.56 

2.40 

2.29 

2.20 

2.13 

2.07 

2.03 

60 

4.00 

3.15 

2.76 

2.53 

2.37 

2.25 

2.17 

2.10 

2.04 

1.99 

80 

3 .% 

3.11 

2.72 

2.49 

2.33 

2.21 

2.13 

2.06 

2.00 

1.95 

100 

3.94 

3.09 

2.70 

2.46 

2.31 

2.19 

2.10 

2.03 

1.97 

1.93 

200 

3.89 

3.04 

2.65 

2.42 

2.26 

2.14 

2.06 

1.98 

1.93 

1.88 

500 

3.86 

3.01 

2.62 

2.39 

2.23 

2.12 

2.03 

1.96 

1.90 

1.85 

1000 

3.85 

3.01 

2.61 

2.38 

2.22 

2.11 

2.02 

1.95 

1.89 

1.84 
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626 Apindice: Tabla G 


TABLA G (continuation) Valores de cuantiles de la distribution F 






1 

— a = 

0.95 








"i = 

grados de libertad del numerador 




*2 

11 

12 

15 

20' 

25 

30 

40 

50 

100 

1000 

1 

242.98 

243.91 

245.% 

248.01 

249.26 

250.08 

251.15 

251.77 

253.01 

254.17 

2 

19.40 

19.41 

19.43 

19.45 

19.46 

19.46 

19.47 

19.48 

19.49 

19.50 

3 

8.76 

8.74 

8.70 

8.66 

8.63 

8.62 

8.59 

8.58 

8.55 

8.53 

4 

5.94 

5.91 

5.86 

5.80 

5.77 

5.74 

5.72 

5.70 

5.66 

5.63 

5 

4.70 

4.68 

4.62 

4.56 

4.52 

4.50 

4.46 

4.44 

4.41 

4.37 

6 

4.03 

4.00 

3.94 

3.87 

3.84 

3.81 

3.77 

3.75 

3.71 

3.67 

7 

3.60 

3.57 

3.51 

3.44 

3.40 

3.38 

3.34 

3.32 

3.27 

3.23 

8 

3.31 

3.28 

3.22 

3.15 

3.11 

3.08 

3.04 

3.02 

2.97 

2.93 

9 

3.10 

3.07 

3.01 

2.94 

2.89 

2.86 

2.83 

2.80 

2.76 

2.71 

10 

2.94 

2.91 

2.85 

2.77 

2.73 

2.70 

2.66 

2.64 

2.59 

2.54 

li 

2.82 

2.79 

2.72 

2.65 

2.60 

2.57 

2.53 

2.51 

2.46 

2.41 

12 

2.72 

2.69 

2.62 

2.54 

2.50 

2.47 

2.43 

2.40 

2.35 

2.30 

13 

2.63 

2.60 

2.53 

2.46 

2.41 

2.38 

2.34 

2.31 

2.26 

2.21 

14 

2.57 

2.53 

2.46 

2.39 

2.34 

2.31 

2.27 

2.24 

2.19 

2.14 

15 

2.51 

2.48 

2.40 

2.33 

2.28 

2.25 

2.20 

2.18 

2.12 

2.07 

16 

2.46 

2.42 

2.35 

2.28 

2.23 

2.19 

2.15 

2.12 

2.07 

2.02 

17 

2.41 

2.38 

2.31 

2.23 

2.18 

2.15 

2.10 

2.08 

2.02 

1.97 

18 

2.37 

2.34 

2.27 

2.19 

2.14 

2.11 

2.06 

2.04 

1.98 

1.92 

19 

2.34 

2.31 

2.23 

2.16 

2.11 

2.07 

2.03 

2.00 

1.94 

1.88 

20 

2.31 

2.28 

2.20 

2.12 

2.07 

2.04 

1.99 

1.97 

1.91 

1.85 

21 

2.28 

2.25 

2.18 

2.10 

2.05 

2.01 

l.% 

1.94 

1.88 

1.82 

22 

2.26 

2.23 

2.15 

2.07 

2.02 

1.98 

1.94 

1.91 

1.85 

1.79 

23 

2.24 

2.20 

2.13 

2.05 

2.00 

l.% 

1.91 

1.88 

1.82 

1.76 

24 

2.22 

2.18 

2.11 

2.03 

1.97 

1.94 

1.89 

1.86 

1.80 

1.74 

25 

2.20 

2.16 

2.09 

2.01 

1.96 

1.92 

1.87 

1.84 

1.78 

1.72 

26 

2.18 

2.15 

2.07 

1.99 

1.94 

1.90 

1.85 

1.82 

1.76 

1.70 

27 

2.17 

2.13 

2.06 

1.97 

1.92 

1.88 

1.84 

1.81 

1.74 

1.68 

28 

2.15 

2.12 

2.04 

1.96 

1.91 

1.87 

1.82 

1.79 

1.73 

1.66 

29 

2.14 

2.10 

2.03 

1.94 

1.89 

1.85 

1.81 

1.77 

1.71 

1.65 

30 

2.13 

2.09 

2.01 

1.93 

1.88 

1.84 

1.79 

1.76 

1.70 

1.63 

35 

2.07 

2.04 

1.96 

1.88 

1.82 

1.79 

1.74 

1.70 

1.63 

1.57 

40 

2.04 

2.00 

1.92 

1.84 

1.78 

1.74 

1.69 

1.66 

1.59 

1.52 

50 

1.99 

1.95 

1.87 

1.78 

1.73 

1.69 

1.63 

1.60 

1.52 

1.45 

60 

1.95 

1.92 

1.84 

1.75 

1.69 

1.65 

1.59 

1.56 

1.48 

1.40 

80 

1.91 

1.88 

1.79 

1.70 

1.64 

1.60 

1.54 

1.51 

1.43 

1.34 

100 

1.89 

1.85 

1.77 

1.68 

1.62 

1.57 

1.52 

1.48 

1.39 

1.30 

200 

1.84 

1.80 

1.72 

1.62 

1.56 

1.52 

1.46 

1.41 

1.32 

1.21 

500 

1.81 

1.77 

1.69 

1.59 

1.53 

1.48 

1.42 

1.38 

1.28 

1.14 

1000 

1.80 

1.76 

1.68 

1.58 

1.52 

1.47 

1.41 

1.36 

1.26 

1.11 
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Aptndice: Tabla G 627 


TABLA G (continuation) >-Valores de cuantiles de la distribution F ' 



t 



■ n. 


0.99 





•' V 

> '* 

1 

2 

' v^^gmitCS de'libertad dei riumerador 
3- 4 5 6 7 

8 

9 

10 

\ 2> 

98.50 

99.00 

99.17 

99.25 

99.30 

99.33 

99.36 

99.37 

99.39' 

99.40 

,3 

34.12 

30.82 

29.46 

28.71 

28.24 

27.91 

27.67 

27.50 

27.34 

27.22 

4 

21.20 

18.00 

16.69 

15.98 

15.52 

15.21 

14.98 

14.80 

14.66 

14.55 

5 

16.26 

13.27 

12.06 

11.39 

10.97 

10.67 

10.46 

10.29 

10.16 

10.05 

6 

13.75 

10.92 

9.78 

9.15 

8.75 

8.47 

8.26 

8.10 

7.98 

7.87 

7 

12.25 

9.55 

8.45 

7.85 

7.46 

7.19 

6.99 

6.84 

6.72 

6.62 

8 

11.26 

8.65 

7.59 

7.01 

6.63 

6.37 

6.18 

6.03 

5.91 

5.81 

9 

10.56 

8.02 

6.99 

6.42 

6.06 

5.80 

5.61 

5.47 

5.35 

5.26 

10 

10.04 

7.56 

-6.55 

5.99 

5.64 

5.39 

5.20 

5.06 

4.94 

4.85 

11 

9.65 

7.21 

6.22 

5.67 

5.32 

5.07 

4.89 

4.74 

4.63 

4.54 

12 

9.33 

6.93 

5.95 

5.41 

5.06 

4.82 

4.64 

4.50 

4.39 

4.30 

13 

9.07 

6.70 

5.74 

5.21 

4.86 

4.62 

4.44 

4.30 

4.19 

4.10 

14 

8.86 

6.51 

5.56 

5.04 

4.69 

4.46 

4.28 

4.14 

4.03 

3.94 

15 

8.68 

6.36 

5.42 

4.89 

4.56 

4.32 

4.14 

4.00 

3.89 

3.80 

16 

8.53 

6.23 

5.29 

4.77 

4.44 

4.20 

4.03 

3.89 

3.78 

3.69 

17 

8.40 

6.11 

5.18 

4.67 

4.34 

4.10 

3.93 

3.79 

3.68 

3.59 

18 

8.29 

6.01 

5.09 

4.58 

4.25 

4.01 

3.84 

3.71 

3.60 

3.51 

19 

8.18 

5.93 

5.01 

4.50 

4.17 

3.94 

3.77 

3.63 

3.52 

3.43 

20 

8.10 

5.85 

4.94 

4.43 

4.10 

3.87 

3.70 

3.56 

3.46 

3.37 

21 

8.02 

5.78 

4.87 

4.37 

4.04 

3.81 

3.64 

3.51 

3.40 

3.31 

22 

7.95 

5.72 

4.82 

4.31 

3.99 

3.76 

3.59 

3.45 

3.35 

3.26 

23 

7.88 

5.66 

4.76 

4.26 

3.94 

3.71 

3.54 

3.41 

3.30 

3.21 

24 

7.82 

5.61 

4.72 

4.22 

3.90 

3.67 

3.50 

3.36 

3.26 

3.17 

25 

7.77 

5.57 

4.68 

4.18 

3.85 

3.63 

3.46 

3.32 

3.22 

3.13 

26 

7.72 

5.53 

4.64 

4.14 

3.82 

3.59 

3.42 

3.29 

3.18 

3.09 

27 

7.68 

5.49 

4.60 

4.11 

3.78 

3.56 

3.39 

3.26 

3.15 

3.06 

28 

7.64 

5.45 

4.57 

4.07 

3.75 

3.53 

3.36 

3.23 

3.12 

3.03 

29 

7.60 

5.42 

4.54 

4.04 

3.73 

3.50 

3.33 

3.20 

3.09 

3.00 

30 

7.56 

5.39 

4.51 

4.02 

3.70 

3.47 

3.30 

3.17 

3.07 

2.98 

35 

7.42 

5.27 

4.40 

3.91 

3.59 

3.37 

3.20 

3.07 

2.96 

2.88 

40 

7.31 

5.18 

4.31 

3.83 

3.51 

3.29 

3.12 

2.99 

2.89 

2.80 

50 

7.17 

5.06 

4.20 

3.72 

3.41 

3.19 

3.02 

2.89 

2.78 

2.70 

60 

7.08 

4.98 

4.13 

3.65 

3.34 

3.12 

2.95 

2.82 

2.72 

2.63 

80 

6.96 

4.88 

4.04 

3.56 

3.26 

3.04 

2.87 

2.74 

2.64 

2.55 

100 

6.90 

4.82 

3.98 

3.51 

3.21 

2.99 

2.82 

2.69 

2.59 

2.50 

200 

6.76 

4.71 

3.88 

3.41 

3.11 

2.89 

2.73 

2.60 

2.50 

2.41 

500 

6.69 

4.65 

3.82 

3.36 

3.05 

2.84 

2.68 

2.55 

2.44 

2.36 

1000 

6.66 

4.63 

3.80 

3.34 

3.04 

2.82 

2.66 

2.53 

2.43 

2.34 
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628, Apindice: Tabla G 


TABLA G (continuackm) Valores de cuantilcs de la distribuci6n F 

1 -a = 0.99 


~. grados de libertad del numerador 


"2 

11 

12 

15 

20 

25 

30 

40 

50 

100 

1000 

2 

99.41 

99.42 

99.43 

99.45 

99.46 

99.46 

99.47 

99.48 

99.49 

99.51 

3 

27.12 

27.03 

26.85 

26.67 

26.58 

26.50 

26.41 

26.35 

26.24 

26.14 

4 

14.45 

14.37 

14.19 

14.02 

13.91 

13.84 

13.75 

13.69 

13.58 

13.48 

5 

9.96 

9.89 

9.72 

9.55 

9.45 

9.38 

9.30 

9.24 

9.13 

9.03 

6 

7.79 

7.72 

7.56 

7.40 

7.29 

7.23 

7.15 

7.09 

6.99 

6.89 

7 

6.54 

6.47 

6.31 

6.16 

6.06 

5.99 

5.91 

5.86 

5.75 

5.66 

8 

5.73 

5.67 

5.52 

5.36 

5.26 

5.20 

5.12 

5.07 

4.% 

4.87 

9 

5.18 

5.11 

4.% 

4.81 

4.71 

4.65 

4.57 

4.52 

4.41 

4.32 

10 

4.77 

4.71 

4.56 

4.41 

4.31 

4.25 

4.17 

4.12 

4.01 

3.92 

11 

4.46 

4.40 

4.25 

4.10 

4.00 

3.94 

3.86 

3.81 

3.71 

3.61 

12 

4.22 

4.16 

4.01 

3.86 

3.76 

3.70 

3.62 

3.57 

3.47 

3.37 

13 

4.02 

3.% 

3.82 

3.66 

3.57 

3.51 

3.43 

3.38 

3.27 

3.18 

14 

3.86 

3.80 

3.66 

3.51 

3.41 

3.35 

3.27 

3.22 

3.11 

3.02 

15 

3.73 

3.67 

3.52 

3.37 

3.28 

3.21 

3.13 

3.08 

2.98 

2.88 

16 

3.62 

3.55 

3.41 

3.26 

3.16 

3.10 

3.02 

2.97 

2.86 

2.76 

17 

3.52 

3.46 

3.31 

3.16 

3.07 

3.00 

2.92 

2.87 

2.76 

2.66 

18 

3.43 

3.37 

3.23 

3.08 

2.98 

2.92 

2.84 

2.78 

2.68 

2.58 

19 

3.36 

3.30 

3.15 

3.00 

2.91 

2.84 

2.76 

2.71 

2.60 

2.50 

20 

3-29 

3.23 

3.09 

2.94 

2.84 

2.78 

2.69 

2.64 

2.54 

2.43 

21 

3.24 

3.17 

3.03 

2.88 

2.78 

2.72 

2.64 

2.58 

2.48 

2.37 

22 

3.18 

3.12 

2.98 

2.83 

2.73 

2.67 

2.58 

2.53 

2.42 

2.32 

23 

3.14 

3.07 

2.93 

2.78 

2.69 

2.62 

2.54 

2.48 

2.37 

2.27 

24 

3.09 

3.03 

2.89 

2.74 

2.64 

2.58 

2.49 

2.44 

2.33 

2.22 

25 

3.06 

2.99 

2.85 

2.70 

2.60 

2.54 

2.45 

2.40 

2.29 

2.18 

26 

3.02 

2.% 

2.81 

2.66 

2.57 

2.50 

2.42 

2.36 

2.25 

2.14 

27 

2.99 

2.93 

2.78 

2.63 

2.54 

2.47 

2.38 

2.33 

2.22 

2.11 

28 

2.96 

2.90 

2.75 

2.60 

2.51 

2.44 

2.35 

2.30 

2.19 

2.08 

29 

2.93 

2.87 

2.73 

2.57 

2.48 

2.41 

2.33 

2.27 

2.16 

2.05 

30 

2.91 

2.84 

2.70 

2.55 

2.45 

2.39 

2.30 

2.24 

2.13 

2.02 

35 

2.80 

2.74 

2.60 

2.44 

2.35 

2.28 

2.19 

2.14 

2.02 

1.90 

40 

2.73 

2.66 

2.52 

2.37 

2.27 

2.20 

2.11 

2.06 

1.94 

1.82 

50 

2.62 

2.56 

2.42 

2.27 

2.17 

2.10 

2.01 

1.95 

1.82 

1.70 

60 

2.56 

2.50 

2.35 

2.20 

2.10 

2.03 

1.94 

1.88 

1.75 

1.62 

80 

2.48 

2.42 

2.27 

2.12 

2.01 

1.94 

1.85 

1.79 

1.65 

1.51 

100 

2.43 

2.37 

2.22 

2.07 

1.97 

1.89 

1.80 

1.74 

1.60 

1.45 

200 

2.34 

2.27 

2.13 

1.97 

1.87 

1.79 

1.69 

1.63 

1.48 

1.30 

500 

2.28 

2.22 

2.07 

1.92 

1.81 

1.74 

1.63 

1.57 

1.41 

1.20 

1000 

2.27 

2.20 

2.06 

1.90 

1.79 

1.72 

1.61 

1.54 

1.38 

1.16 
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/ipenaice; iaota n oxy 


TAB LA H £-valores para los iimites de tolerancia bilateral es cuando sc muestrean 
distribuciones norm ales 


X 

0.75 

0.90 

y = 0.75 

0.95 

0.99 

0.999 

. 0.75 

0.90 

y = 0.90 - 

: 0.95 0.99 ; 

0.999 

6 

1.704 

\ 2.429 

2.889 

3.779 

4.802 

2.1% 

3.131 

3.723 

4.870 

6.188 

7 

1.624 

2.318 

2.757 

3.611 

4.593 

2.034 

2.902 

3.452 

4.521 

5.750 

8 

1.568 

2.238 

2.663 

3.491 - 

4.444 

1.921 

2.743 

3.264 

4.278 

5.446 

9 

1.525 

2.178 

2.593 

3.400 

4.330 

1.839 

2.626 

3.125 

4.098 

5.220 

10 

1.492 

2.131 

2.537 

3.328 

4.241 

1.775 

2.535 

3.018 

3.959 

5.046 

11 

1.465 

2.093 

2.493 

3.271 

4.169 

1.724 

2.463 

2.933 

3.849 

4.906 

12 

1.443 

2.062 

2.456 

3.223 

4.110 

1.683 

2.404 

2.863 

3.758 

4.792 

13 

1.425 

2.036 

2.424 

3.183 

4.059 

1.648 

2.355 

•2.805 

3.682 

4.697 

14 

1.409 

2.013 

2.398 

3.148 

4.016 

1.619 

2.314 

2.756 

3.618 

4.615 

15 

1.395 

1.994 

2.375 

3.118 

3.979 

1.594 

2.278 

2.713 

3.562 

4.545 

16 

1.383 

1.977 

2.355 

3.092 

3.946 

1.572 

2.246 

2.676 

3.514 

4.484 

17 

1.372 

1.962 

2.337 

3.069 

3.917 

1.552 

2.219 

2.643 

3.471 

4.430 

18 

1.363 

1.948 

2.321 

3.048 

3.891 

1.535 

2.194 

2.614 

3.433 

4.382 

19 

1.355 

1.936 

2.307 

3.030 

3.867 

1.520 

2.172 

2.588 

3.399 

4.339 

20 

1.347 

1.925 

2.294 

3.013 

3.846 

1.506 

2.152 

2.564 

3.368 

4.300 

21 

1.340 

1.915 

2.282 

2.998 

3.827 

1.493 

2.135 

2.543 

3.340 

4.264 

22 

1.334 

1.906 

2.271 

2.984 

3.809 

1.482 

2.118 

2.524 

3.315 

4.232 

23 

1.328 

1.898 

2.261 

2.971 

3.793 

1.471 

2.103 

2.506 

3.292 

4.203 

24 

1.322 

1.891 

2.252 

2.959 

3.778 

1.462 

2.089 

2.489 

3.270 

4.176 

25 

1.317 

1.883 

2.244 

2.948 

3.764 

1.453 

2.077 

2.474 

3.251 

4.151 

26 

1.313 

1.877 

2.236 

2.938 

3.751 

1.444 

2.065 

2.460 

3.232 

4.127 

27 

1.309 

1.871 

2.229 

2.929 

3.740 

1.437 

2.054 

2.447 

3.215 

4.106 

28 

1.305 

1.865 

2.222 

2.920 

3.728 

1.430 

2.044 

2.435 

3.199 

4.085 

29 

1.301 

- 1.860 

2.216 

2.911 

3.718 

1.423 

2.034 

2.424 

3.184 

4.066 

30 

1.297 

1.855 

2.210 

2.904 

3.708 

1.417 

2.025 

2.413 

3.170 

4.049 

31 

1.294 

1.850 

2.204 

2.8% 

3.699 

1.411 

2.017 

2.403 

3.157 

4.032 

32 

1.291 

1.846 

2.199 

2.890 

3.690 

1.405 

2.009 

2.393 

3.145 

4.016 

33 

1.288 

1.842 

2.194 

2.883 

3.682 

1.400 

2.001 

2.385 

3.133 

4.001 

34 

1.285 

1.838 

2.189 

2.877 

3.674 

1.395 

1.994 

2.376 

3.122 

3.987 

35 

1.283 

1.834 

2.185 

2.871 

3.667 

1.390 

1.988 

2.368 

3.112 

3.974 

36 

1.280 

1.830 

2.181 

2.866 

3.660 

1.386 

1.981 

2.361 

3.102 

3.%1 

37 

1.278 

1.827 

2.177 

2.860 

3.653 

1.381 

1.975 

2.353 

3.092 

3.949 

38 

1.275 

1.824 

2.173 

2.855 

3.647 

1.377 

l.%9 

2.346 

3.083 

3.938 

39 

1.273 

1.821 

2.169 

2.850 

3.641 

1.374 

1.964 

2.340 

3.075 

3-927 

40 

1.271 

1.818 

2.166 

2.846 

3.635 

1.370 

1.959 

2.334 

3.066 

3.917 

41 

1.269 

1.815 

2.162 

2.841 

3.629 

1.366 

1.954 

2.328 

3.059 

3.907 

42 

1.267 

1.812 

2.159 

2.837 

3.624 

1.363 

1.949 

2.322 

3.051 

3.897 

43 

1.266 

1.810 

2.156 

2.833 

3.619 

1.360 

1.944 

2.316 

3.044 

3.888 

44 

1.264 

1.807 

2.153 

2.829 

3.614 

1.357 

1.940 

2.311 

3.037 

3.879 

45 

1.262 

1.805 

2.150 

2.826 

3.609 

1.354 

1.935 

2.306 

3.030 

3.871 

46 

1.261 

1.802 

2.148 

2.822 

3.605 

1.351 

1.931 

2.301 

3.024 

3.863 

47 

1.259 

1.800 

2.145 

2.819 

3.600 

1.348 

1.927 

2.297 

3.018 

3.855 

48 

1.258 

1.798 

2.143 

2.815 

3.5% 

1.345 

1.924 

2.292 

3.012 

3.847 

49 

L256 

1.7% 

2.140 

2.812 

3.592 

1.343 

1.920 

2.288 

3.006 

3.840 

50 

1.255 

1.794 

2.138 

2.809 

3.588 

1.340 

1.916 

2.284 

3.001 

3.833 
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TABLA H (continuaci6n) Ar-valores para los limites de tolerancia bilaterales cuando se 
muestrean distribuciones normales 


X 

0.75 

0.90 

y = 0.95 

0.95 

0.99 

0.999 

0.75 

' 0.90 

y = 0.99 

0.95 0.99 

3. 

0.999 

6 

2.604 

.3.712 

4.414 

5.775 

7.337 

3.743 „ 

5.337 ;; 

ti 6.345 , 

8.301 

10.548. 

7 

2.361 

3.369 

4.007 

5.248 

6.676 

3.233 

4.613 

5.488 

7.187 

9.142 

8 

2.197 

3.136 

3.732 

4.891 

6.226 

2.905 

4.147 

4.936 

6.468 

8.234 

9 

2.078 

' 2.967 

3.532 ‘ 

4.631 

5.899 

2.677 

3.822 

4.550 

5.966 

7:600 

10 

1.987 

2.839 

3.379 

4.433 

5.649 

2.508 

3.582 

4.265 

5.594 

7.129 

11 

1.916 

2.737 

3.259 

4.277 

5.452 

2.378 

3.397 

4.045 

5.308 

6.766 

12 

1.858 

2.655 

3.162 

4.150 

5.291 

2.274 

3.250 

3.870 

5.079 

6.477 

13 

1.810 

2.587 

3.081 

4.044 

5.158 

2.190 

3.130 

3.727 

4.893 

6.240 

14 

1.770 

2.529 

3.012 

3.955 

5.045 

2.120 

3.029 

3.608 

4.737 

6.043 

15 

1.735 

2.480 

2.954 

3.878 

4.949 

2.060 

2.945 

3.507 

4.605 

5.876 

16 

1.705 

2.437 

2.903 

3.812 

4.865 

2.009 

2.872 

3.421 

4.492 

5.732 

17 

1.679 

2.400 

2.858 

3.754 

4.791 

1.965 

2.808 

3.345 

4.393 

5.607 

18 

1.655 

2.366 

2.819 

3.702 

4.725 

1.926 

2.753 

1.27Q 

4.307 

5.497 

19 

1.635 

2.337 

2.784 

3.656 

4.667 

1.891 

2.703 

3.221 

4.230 

5.399 

20 

1.616 

2.310 

2.752 

3.615 

4.014 

1.860 

2.659 

3.168 

4.161 

5.312 

21 

1.599 

2.286 

2.723 

3.577 

4.567 

1.833 

2.620 

3.121 

4.100 

5.234 

22 

1.584 

2.264 

2.697 

3.543 

4.523 

1.808 

2.584 

3.078 

4.044 

5.163 

23 

1.570 

2.244 

2.673 

3.512 

4.484 

1.785 

2.551 

3.040 

3.993 

5.098 

24 

1.557 

2.225 

2.651 

3.483 

4.447 

1.764 

2.522 

3.004 

3.947 

5.039 

25 

1.545 

2.208 

2.631 

3.457 

4.413 

1.745 

2.494 

2.972 

3.904 

4.985 

26 

1.534 

2.193 

2.612 

3.432 

4.382 

1.727 

2.469 

2.941 

3.865 

4.935 

27 

1.523 

2.178 

2.595 

3.409 

4.353 

1.711 

2.446 

2.914 

3.828 

4.888 

28 

1.514 

2.164 

2.579 

3.388 

4.326 

1.695 

2.424 

2.888 

3.794 

4.845 

29 

1.505 

2.152 

2.554 

3.368 

4.301 

1.681 

2.404 

2.864 

3.763 

4.805 

30 

1.497 

2.140 

2.549 

3.350 

4.278 

1.668 

2.385 

2.841 

3.733 

4.768 

31 

1.489 

2.129 

2.536 

3.332 

4.256 

1.656 

2.367 

2.820 

3.706 

4.732 

32 

1.481 

2.118 

2.524 

3.316 

4.235 

1.644 

2.351 

2.801 

3.680 

4.699 

33 

1.475 

2.108 

2.512 

3.300 

4.215 

1.633 

2.335 

2.782 

3.655 

4.668 

34 

1.468 

2.099 

2.501 

3.286 

4.197 

1.623 

2.320 

2.764 

3.632 

4.639 

35 

1.462 

2.090 

2.490 

3.272 

4.179 

1.613 

2.306 

2.748 

3.611 

4.611 

36 

1.455 

2.081 

2.479 

3.258 

4.161 

1.604 

2.293 

2.732 

3.590 

4.585 

37 

1.450 

2.073 

2.470 

3.246 

4.146 

1.595 

2.281 

2.717 

3.571 

4.560 

38 

1.446 

2.068 

2.464 

3.237 

4.134 

1.587 

2.269 

2,703 

3.552 

4.537 

39 

1.441 

2.060 

2.455 

3.226 

4.120 

1.579 

2.257 

2.690 

3.534 

4.514 

40 

1.435 

2.052 

2.445 

3.213 

4.104 

1.571 

2.247 

2.677 

3.518 

4.493 

41 

1.430 

2.045 

2.437 

3.202 

4.090 

1.564 

2.236 

2.665 

3.502 

4.472 

42 

1.426 

2.039 

2.429 

3.192 

4.077 

1.557 

2.227 

2.653 

3.486 

4.453 

43 

1.422 

2.033 

2.422 

3.183 

4.065 

1.551 

2.217 

2.642 

3.472 

4.434 

44 

1.418 

2.027 

2.415 

3.173 

4.053 

1.545 

2.208 

2.631 

3.458 

4.416 

45 

1.414 

2.021 

2.408 

3.165 

4.042 

1.539 

2.200 

2.621 

3.444 

4.399 

46 

1.410 

2.016 

2.402 

3.156 

4.031 

1.533 

2.192 

2.611 

3.431 

4.383 

47 

1.406 

2.011 

2.3% 

3.148 

4.021 

1.527 

2.184 

2.602 

3.419 

4.367 

48 

1.403 

2.006 

2.390 

3.140 

4.011 

1.522 

2.176 

2.593 

3.407 

4.352 

49 

1.399 

2.001 

2.384 

3.133 

4.002 

1.517 

2.169 

2.584 

3.396 

4.337 

50 

1.396 

1.969 

2.379 

3.126 

3.993 

1.512 

2.162 

2.576 

3.385 

4.323 


Source: C. Eisenhart, M. W. Hastay, and W. A. Wallis, Techniques of statistical analysis, McGraw- 
Hill, New York, 1947. Publicado con permiso. 
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Apenaice: i aoia 1 oji 


TABLA I Ar-valores para los limites de tolerancia unilaterales cuando sc muestrean 
distribuciones normales , . f v > 


i 

0.75 

0.90 

y = 0.75 

0.95 0.99 

0.999, 

0.75, 

y = 0.90 

0.90 0 95/ 0.99 

0.999 

6 

1.087 

1.860 

2.336 

3.243 

4.273 

1.540 

2.494 

3.091 

4.242 

5.556 

• 7 • 

1.043 

1.791 

2.250 

3.126 

4.118 

1.435 

2.333 

2.894 

3.972 

5.201 

8 

1.010 

1.740 

2.190 

3.042 

4.008 

1.360 

2.219 

2.755 

3.783 

4.955 

9 

0.984 

1.702 

2.141 

2.977 

3.924 

1.302 

2.133 

2.649 

3.641 

4.772 

10 

0.964 

1.671 

2.103 

2.927 

3.858 

1.257 

2.065 

2.568 

3.532 

4.629 

11 

0.947 

1.646 

2.073 

2.885 

3.804 

1.219 

2.012 

2.503 

3.444 

4.515 

12 

0.933 

1.624 

2.048 

2.851 

3.760 

1.188 

1.966 

2.448 

3.371 

4.420 

13 

0.919 

1.606 

2.026 

2.822 

3.722 

1.162 

1.928 

2.403 

3.310 

4.341 

14 

0.909 

1.591 

2.007 

2.7% 

3.690 

1.139 

1.895 

2.363 

3.257 

4.274 

15 

0.899 

1.577 

1.991 

2.776 

3.661 

1.119 

1.866 

2.329 

3.212 

4.215 

16 

0.891 

1.566 

1.977 

2.756 

3.637 

1.101 

1.842 

2.299 

3.172 

4.164 

17 

0.883 

1.554 

1.964 

2.739 

3.615 

1.085 

1.820 

2.272 

3.136 

4.118 

18 

0.876 

1.544 

1.951 

2.723 

3.595 

1.071 

1.800 

2.249 

3.106 

4.078 

19 

0.870 

1.536 

1.942 

2.710 

3.577 

1.058 

1.781 

2.228 

3.078 

4.041 

20 

0.865 

1.528 

1.933 

2.697 

3.561 

1.046 

1.765 

2.208 

3.052 

4.009 

21 

0.859 

1.520 

1.923 

2.686 

3.545 

1.035 

1.750 

2.190 

3.028 

3.979 

22 

0.854 

1.514 

1.916 

2.675 

3.532 

1.025 

1.736 

2.174 

3.007 

3.952 

23 

0.849 

1.508 

1.907 

2.665 

3.520 

1.016 

1.724 

2.159 

2.987 

3.927 

24 

0.845 

1.502 

1.901 

2.656 

3.509 

1.007 

1.712 

2.145 

2.969 

3.904 

25 

0.842 

1.496 

1.895 

2.647 

3.497 

0.999 

1.702 

2.132 

2.952 

3.882 

30 

0.825 

1.475 

1.869 

2.613 

3.454 

0.966 

1.657 

2.080 

2.884 

3.794 

35 

0.812 

1.458 

1.849 

2.588 

3.421 

0.942 

1.623 

2.041 

2.833 

3.730 

40 

0.803 

1.445 

1.834 

2.568 

3.395 

0.923 

1.598 

2.010 

2.793 

3.679 

45 

0.795 

1.435 

1.821 

2.552 

3.375 

0.908 

1.577 

1.986 

2.762 

3.638 

50 

0.788 

1.426 

1.811 

2.538 

3.358 

0.894 

1.560 

1.965 

2.735 

3.604 
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632 Apindice: Tabla I 


TABLA I (continuad6n) Ar-vaJores para los limites de tolerancia unilaterales cuando se 
muestrean distribuciones normales . ^ 


X 

0.75 

0.90 

y = 0.95 

0.95 

0.99 

0.999 

0.75 

0.90 

y = 0.99 

0.95 

0.99 

0.999 

6 

1.895 

3.006 

3.707 

5.062 

6.612 

2.849 

4.408 

5.409 

7.334 

9.540 

7 

1.732 

2.755 

3.399 

4.641 

6.061 

2.490 

3.856 

4.730 

6.411 

8.348 

8 

1.617 

2.582 

3.188 

4.353 

5.686 

2.252 

3.4% 

4.287 

5.811 

7.566 

9 

1.532 

2.454 

3.031 

4.143 

5.414 

2.085 

3.242 

3.971 

5.389 

7.014 

10 

1.465 

2.355 

2.911 

3.981 

5.203 

1.954 

3.048 

3.739 

5.075 

6.603 

11 

1.411 

2.275 

2.815 

3.852 

5.036 

1.854 

2.897 

3.557 

4.828 

6.284 

12 

1.366 

2.210 

2.736 

3.747 

4.900 

1.771 

2.773 

3.410 

4.633 

6.032 

13 

1.329 

2.155 

2.670 

3.659 

4.787 

1.702 

2.677 

3.290 

4.472 

5.826 

14 

1.2% 

2.108 

2.614 

3.585 

4.690 

1.645 

2.592 

3.189 

4.336 

5.651 

15 

1.268 

2.068 

2.566 

3.520 

4.607 

1.5% 

2.521 

3.102 

4.224 

5.507 

16 

1.242 

2.032 

2.523 

3.463 

4.534 

1.553 

2.458 

3.028 

4.124 

5.374 

17 

1.220 

2.001 

2.486 

3.415 

4.471 

1.514 

2.405 

2.%2 

4.038 

5.268 

18 

1.200 

1.974 

2.453 

3.370 

4.415 

1.481 

2.357 

2.906 

3.%1 

5.167 

19 

1.183 

1.949 

2.423 

3.331 

4.364 

1.450 

2.315 

2.855 

3.893 

5.078 

20 

1.167 

1.926 

2.3% 

3.295 

4.319 

1.424 

2.275 

2.807 

3.832 

5.003 

21 

1.152 

1.905 

2.371 

3.262 

4.276 

1.397 

2.241 

2.768 

3.776 

4.932 

22 

1.138 

1.887 

2.350 

3.233 

4.238 

1.376 

2.208 

2.729 

3.727 

4.866 

23 

1.126 

1.869 

2.329 

3.206 

4.204 

1.355 

2.179 

2.693 

3.680 

4.806 

24 

1.114 

1.853 

2.309 

3.181 

4.171 

1.336 

2.154 

2.663 

3.638 

4.755 

25 

1.103 

1.838 

2.292 

3.158 

4.143 

1.319 

2.129 

2.632 

3.601 

4.706 

30 

1.059 

1.778 

2.220 

3.064 

4.022 

1.249 

2.029 

2.516 

3.446 

4.508 

35 

1.025 

1.732 

2.166 

2.994 

3.934 

1.195 

1.957 

2.431 

3.334 

4.364 

40 

0.999 

1.697 

2.126 

2.941 

3.866 

1.154 

1.902 

2.365 

3.250 

4.255 

45 

0.978 

1.669 

2.092 

2.897 

3.811 

1.122 

1.857 

2.313 

3.181 

4.168 

50 

0.%1 

1.646 

2.065 

2.863 

3.766 

1.0% 

1.821 

2.2% 

3.124 

4.0% 


Source: G. J. Lieberman, Table for one-sided statistical tolerance limits, Industrial Quality Control 
XIV, 1958, 7-9. Reprinted with permission. 
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Aptndice: labia J 6JJ 


TABLA J Valores de cuantiles superiors de la distribution de la estadistica D n de Kolgomo- 
rov-Smirnov . - 


n 



1 - a 



0.80 

0.85 

0.90 

0.95 

0.99 

\ 1 \ 

.900 

.925 

.950 

.975 

.995 

' 2 

.684 

.726. \ 

.776 

.842 

.929 

3 

.565 

.597 

.642 

.708 

.828 

4 

.494 

.525 

.564 

.624 

.733 

5 

.446 

.474 

.510 

.565 

.669 

6 

.410 

.436 

.470 

.521 

.618 

7 

.381 

.405 

.438 

.486 

.577 

8 

.358 

.381 

.411 

.457 

.543 

9 

.339 

.360 

.388 

.432 

.514 

10 

.322 

.342 

.368 

.410 

.490 

:i 

.307 

.326 

.352 

.391 

.468 

12 

.295 

.313 

.338 

.375 

.450 

13 

.284 

.302 

.325 

.361 

.433 

14 

.274 

.292 

.314 

.349 

.418 

15 

.266 

.283 

.304 

.338 

.404 

16 

.258 

.274 

.295 

.328 

.392 

17 

.250 

.266 

.286 

.318 

.381 

18 

.244 

.259 

.278 

.309 

.371 

19 

.237 

.252 

.272 

.301 

.363 

20 

.231 

.246 

.264 

.294 

.356 

25 

.21 

.22 

.24 

.27 

.32 

30 

.19 

.20 

.22 

.24 

.29 

35 

.18 

.19 

.21 

.23 

.27 

F6rmula para una 

1.07 

1.14 

1.22 

1.36 

1.63 

n mayor 

Vn 

Vn 

Vn 

Vn 

Vn 


Fuente: F. J. Massey, Jr., The Kolmogorov-Smornov test for goodness offit, J. Amer Statistical Assoc. 
46 (1951), 68-78. Publicado con permiso. 
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634 Apindice : Tab la K 


TAB LA K Limites de la estadistica de Durbin-Watson 






1 - 

- a 

0.95 






sm 

Ml 




= 3 -. 

k = 

= 4 

k = 

= 5 

n 



m 



• ' dy 

d L 

du 

d L 

du 

15 

1.08 

1.36 



0.82 

1.75 


mm 

0.56 

2.21 

16 

1.10 

1.37 


■El 

0.86 

1.73 


HI 

0.62 

2.15 

17 

1.13 

1.38 

1.02 

1.54 

0.90 

1.71 


1.90 

0.67 

2.10 

18 

1.16 

1.39 

1.05 

1.53 

0.93 

1.69 

MM 


0.71 

2.06 

19 

1.18 

1.40 

1.08 

1.53 

0.97 

1.68 

0.86 

1.85 

0.75 

2.02 

20 

1.20 

1.41 

1.10 

1.54 

1.00 

1.68 

0.90 

1.83 

0.79 

1.99 

21 

1.22 

1.42 

1.13 

1.54 

1.03 

1.67 

0.93 

1.81 

0.83 

1.96 

22 

1.24 

1.43 

1.15 

1.54 

1.05 

1.66 

0.96 

1.80 

0.86 

1.94 

23 

1.26 

1.44 

1.17 

1.54 

1.08 

1.66 

0.99 

1.79 

0.90 

1.92 

24 

1.27 

1.45 

1.19 

1.55 

1.10 

1.66 

1.01 

1.78 

0.93 

1.90 

25 

1.29 

1.45 

1.21 

1.55 

1.12 

1.66 

1.04 

1.77 

0.95 

1.89 

26 

1.30 

1.46 

1.22 

1.55 

1.14 

1.65 

1.06 

1.76 

0.98 

1.88 

27 

1.32 

1.47 

1.24 

1.56 

1.16 

1.65 

1.08 

1.76 

1.01 

1.86 

28 

1.33 

1.48 

1.26 

1.56 

1.18 

1.65 

1.10 

1.75 

1.03 

1.85 

29 

1.34 

1.48 

1.27 

1.56 

1.20 

1.65 

1.12 

1.74 

1.05 

1.84 

30 

1.35 

1.49 

1.28 

1.57 

1.21 

1.65 

1.14 

1.74 

1.07 

1.83 

31 

1.36 

1.50 

1.30 

1.57 

1.23 

1.65 

1.16 

1.74 

1.09 

1.83 

32 

1.37 

1.50 

1.31 

1.57 

1.24 

1.65 

1.18 

1.73 

1.11 

1.82 

33 

1.38 

1.51 

1.32 

1.58 

1.26 

1.65 

1.19 

1.73 

1.13 

1.81 

34 

1.39 

1.51 

1.33 

1.58 

1.27 

1.65 

1.21 

1.73 

1.15 

1.81 

35 

1.40 

1.52 

1.34 

1.58 

1.28 

1.65 

1.22 

1.73 

1.16 

1.80 

36 

1.41 

1.52 

1.35 

1.59 

1.29 

1.65 

1.24 

1.73 

1.18 

1.80 

37 

1.42 

1.53 

1.36 

1.59 

1.31 

1.66 

1.25 

1.72 

1.19 

1.80 

38 

1.43 

1.54 

1.37 

1.59 

1.32 

1.66 

1.26 

1.72 

1.21 

1.79 

39 

1.43 

1.54 

1.38 

1.60 

1.33 

1.66 

1.27 

1.72 

1.22 

1.79 

40 

1.44 

1.54 

1.39 

1.60 

1.34 

1.66 

1.29 

1.72 

1.23 

1.79 

45 

1.48 

1.57 

1.43 

1.62 

1.38 

1.67 

1.34 

1.72 

1.29 

1.78 

50 

1.50 

1.59 

1.46 

1.63 

1.42 

1.67 

1.38 

1.72 

1.34 

1.77 

55 

1.53 

1.60 

1.49 

1.64 

1.45 

1.68 

1.41 

1.72 

1.38 

1.77 

60 

1.55 

1.62 

1.51 

1.65 

1.48 

1.69 

1.44 

1.73 

1.41 

1.77 

65 

1.57 

1.63 

1.54 

1.66 

1.50 

1.70 

1.47 

1.73 

1.44 

1.77 

70 

1.58 

1.64 

1.55 

1.67 

1.52 

1.70 

1.49 

1.74 

1.46 

1.77 

75 

1.60 

1.65 

1.57 

1.68 

1.54 

1.71 

1.51 

1.74 

1.49 

1.77 

80 

1.61 

1.66 

1.59 

1.69 

1.56 

MSm 


1.74 

1.51 

1.77 

85 

1.62 

1.67 

1.60 

1.70 

1.57 


pipl 

1.75 

1.52 

1.77 

90 

1.63 

1.68 

1.61 

1.70 

1.59 



1.75 

1.54 

1.78 

95 

1.64 

1.69 

1.62 

1.71 

1.60 



1.75 

1.56 

1.78 

100 

1.65 

1.69 

1.63 

1.72 

1.61 



1.76 

1.57 

1.78 
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TABLA K ( continuation ) Limites de la estadistica de Durbin-Watson 






1 - 

- a = 0.99 


-*»■ *»* VS f v 

■ „ 

if " r 

t 

n 

H 

m 

■ 

= 2 

d v 

H 

gUg 



EM 


15 

0.81 

1.07 

0.70 

1.25 > 

■ 0.59 

1.46 

f 0.49 ’ 

1*70- 

0 .- 39 " 

1.96 

16 

0.84 

1.09 

0.74 

1.25 

0.63 

1.44 

0.53 

1.66 

0.44 

1.90 

17 

0.87 

1.10 

0.77 

1.25 

0.67 

1.43 

0.57 

1.63 

0.48 

1.85 

18 

0.90 

1.12 

0.80 

1.26 

0.71 

1.42 

0.61 

1.60 " 

0.52 

1.80 

19 

0.93 

1.13 

0.83 

1.26 

0.74 

1.41 

0.65 

1.58 

0.56 

1.77 

20 

0.95 

1.15 

0.86 

1.27 

0.77 

1.41 

0.68 

1.57 

0.60 

1.74 

21 

0.97 

1.16 

0.89 

1.27 

0.80 

1.41 

0.72 

1.55 

0.63 

1.71 

22 

1.00 

1.17 

0.91 

1.28 

0.83 

1.40 

0.75 

1.54 

0.66 

1.69 

23 

1.02 

1.19 

0.94 

1.29 

0.86 

1.40 

0.77 

1.53 

0.70 

1.67 

24 

1.04 

1.20 

G .96 

1.30 

0.88 

1.41 

0.80 

1.53 

0.72 

1.66 

25 

1.05 

1.21 

0.98 

1.30 

0.90 

1.41 

0.83 

1.52 

0.75 

1.65 

26 

1.07 

1.22 

1.00 

1.31 

0.93 

1.41 

0.85 

1.52 

0 . 7 o 

1.64 

27 

1.09 

1.23 

1.02 

1.32 

0.95 

1 41 

0.88 

1.51 

0.81 

1.63 

28 

1.10 

1.24 

1.04 

1.32 

0.97 

1.41 

0.90 

1.51 

0.83 

1.62 

29 

1.12 

1.25 

1.05 

1.33 

0.99 

1.42 

0.92 

1.51 

0.85 

1.61 

30 

1.13 

1.26 

1.07 

1.34 

1.01 

1.42 

0.94 

1.51 

0.88 

1.61 

31 

1.15 

1.27 

1.08 

1.34 

1.02 

1.42 

0.96 

1.51 

0.90 

1.60 

32 

1.16 

1.28 

1.10 

1.35 

1.04 

1.43 

0.98 

1.51 

0.92 

1.60 

33 

1.17 

1.29 

1.11 

1.36 

1.05 

1.43 

1.00 

1.51 

0.94 

1.59 

34 

1.18 

1.30 

1.13 

1.36 

1.07 

1.43 

1.01 

1.51 

0.95 

1.59 

35 

1.19 

1.31 

1.14 

1.37 

1.08 

1.44 

1.03 

1.51 

0.97 

1.59 

36 

1.21 

1.32 

1.15 

1.38 

1.10 

1.44 

1.04 

1.51 

0.99 

1.59 

37 

1.22 

1.32 

1.16 

1.38 

1.11 

1.45 

1.06 

1.51 

1.00 

1.59 

38 

1.23 

1.33 

1.18 

1.39 

1.12 

1.45 

1.07 

1.52 

1.02 

1.58 

39 

1.24 

1.34 

1.19 

1.39 

1.14 

1.45 

1.09 

1.52 

1.03 

1.58 

40 

1.25 

1.34 

1.20 

1.40 

1.15 

1.46 

1.10 

1.52 

1.05 

1.58 

45 

1.29 

1.38 

1.24 

1.42 

1.20 

1.48 

1.16 

1.53 

1.11 

1.58 

50 

1.32 

1.40 

1.28 

1.45 

1.24 

1.49 

1.20 

1.54 

1.16 

1.59 

55 

1.36 

1.43 

1.32 

1.47 

1.28 

1.51 

1.25 

1.55 

1.21 

1.59 

60 

1.38 

1.45 

1.35 

1.48 

1.32 

1.52 

1.28 

1.56 

1.25 

1.60 

65 

1.41 

1.47 

1.38 

1.50 

1.35 

1.53 

1.31 

1.57 

1.28 

1.61 

70 

1.43 

1.49 

1.40 

1.52 

1.37 

1.55 

1.34 

1.58 

1.31 

1.61 

75 

1.45 

1.50 

1.42 

1.53 

1.39 

1.56 

1.37 

1.59 

1.34 

1.62 

80 

1.47 

1.52 

1.44 

1.54 

1.42 

1.57 

1.39 

1.60 

1.36 

1.62 

85 

1.48 

1.53 

1.46 

1.55 

1.43 

1.58 

1.41 

1.60 

1.39 

1.63 

90 

1.50 

1.54 

1.47 

1.56 

1.45 

1.59 

1.43 

1.61 

1.41 

1.64 

95 

1.51 

1.55 

1.49 

1.57 

1.47 

1.60 

1.45 

1.62 

1.42 

1.64 

100 

1.52 

1.56 

1.50 

1.58 

1.48 

1.60 

1.46 

1.63 

1.44 

1.65 


Fuente: J. Durbin and G. S. Watson, Testing for serial correlation in least squares regression, //.Biome- 
trika 38 (1951), 159-178. Publieado con permiso de Biometrika Trustees. 
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Respuestas a los ejercicios 
seleccionados de numero impar 


Capitulo 1 

11- a).b) . 

Limites 

verdaderos 


Frecuencia de Frecuencia 
la dose relativa 


Frecuenda 

relativa 

acumulativa 


(0.15, 1.55) 

17 

0.34 

0.34 

(1.55, 2.95) 

11 

0.22 

0.56 

(2.95, 4.35) 

7 

0.14 

0.70 

(4.35, 5.75) 

6 

0.12 

0.82 

(5.75, 7.15) 

4 

0.08 

0.90 

(7.15, 8.55) 

3 

0.06 

0.96 

(8.55, 9.95) 

2 

0.04 

1.00 

Totales 

50 

1.00 



c) Los intervalos intercuantil e interdecil son, en forma aproximada, iguales a 3.8 min y 
6.7 min, respectivamente. 

d) x = 3.258; Mediana = 2.6182; Moda = 0.85; s = 2.4986; M.D. = 2.081; y 
Md.D. = 2.0042 

e) x = 3.26; Median = 2.75; Moda = 0.4; s = 2.4819; M.D. = 2.0056; y 
Md.D. = 1.948 

1.3. x = 3.5; las varianzas son sj = 3.5, s\ = 7.5, > s| = 109.9 

1.5. a) Limites Frecuenda 

verdaderos Frecuenda relativa 


(-1.875, 

-1.125) 

5 

0.1667 

(-1.125, 

-0.375) 

5 

0.1667 

(-0.375, 

0.375) 

8 

0.2667 

(0.375, 

1.125) 

8 

0.2667 

(1.125, 

1.875) 

4 

0.1333 

Totales 


30 

1.0001 


Ningun cambio en la distribucion de frecuencia relativa 
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Respuestas 637 


1.7. b) x = 18.82; Moda = 14.0 

cj s 2 = 123.41%; j = 11.11; M.D. = 9.27 

Capitulo 2 

2.1. a) Los eventos no son mutuamente excluyentes 

b) f. 180/400; 2. 150/400; 3. 30/400; 4. 60/180; 5. 60/200 

c) P(S | A/) = 50/220; P(S) = 150/400; no son estadisticamente indepcndientes 

d) No; P(A | F) = 0.1111, P(A) = 0.125 

e) I. 240/400; 2. 210/400; 3. 60/400; 4. 30/50 

2.3. Cuando alguno o ambos eventos son vacios 

2.5. Las permutaciones son GGG, GGB, GBG, BGG, BfiG, BGB, y BBB. La probabilidad 
de tener dos niflos del mismo sexo es 6/8; la probabilidad de un niilo y dos niflos es 3/8; 
la probabilidad de que todos sean del mismo sexo es 2/8. 

2.7. (1/2)'°; 1/2 

2.9. 13/30 

2.11. a) Cuatro resultados posibles: ambos componentes trabajan; ambos no y uno trabaja 
y el otro no (en dos formas posibles) 
b) 0.99 

2.13. n = 4 
2.15 . 0.6571 
2.17. 0.41 

Capitulo 3 


X 

pM 

Fix) 

0 

0.0498 

0.0498 

l 

0.1494 

0.1992 

2 

0.2240 

0.4232 

3 

0.2240 

0.6472 

4 

0.1680 

0.8152 

5 

0.1008 

0.9160 

6 

0.0504 

0.9664 

7 

0.0216 

0.9880 


3.3. a) 3/2; b) (.r’ + l)/2; c) 7/16, 1/8 

3.5. a) (l/100)exp(-x/100); b) 0.8187 

3.7. E(X) = 4; Var(X) = 4.1 

3.9. a) 1/3; b) 1/18 

3.11. a) 4; b) 16; c) 2; d) 9 

e) La distribution del ejercicio 3.10 es simetrica y se encuentra centrada alrededor del 
valor 5, tiene varianza igual a 8.33 y desviacion estandar de 2.8868. Esta distribution 
tiene un sesgo positivo y un pico relativamente grande; la dispersion relativa tambien 
es grande. 

3.13. a) a 2 + (p. - c) : ; b) c = p 
3.15. M.D.(X) = 0.19753, d.e. (X) = 0.2357 
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3.17. a) Media = 800,Mediana = 554.52; b) 878.89 c) 1757.78; d) 0.3679 

3.19. a) (l - 40" 2 b) E(X) = 8, Var (X) = 32 

Capitulo 4 

4.5. a) 0.6562, 0.9346; , b) 0.5696, 0.9391 

4.7. P(X = 4) = 0.0049, / > (A' 4) = 0.0055; existe una inclination a concluir que la afir- 

macion es incorrecta 
4.9. 0.2122 

4.11. Seis o mas 

4.15. 0.7601, 0.9718 

4.17. 0.0488 

4.19. 0.0803, 0.9862 
4.21. 0.6767 

4.23. 0.0293, si 
4.25. 0.1837, no 

4.27. a) 0.5973; b) 5987; c) 0.6065 


X 

Frecuencia 

relativa 

Probabilidad 

teorica 

0 

0.715 

0.7201 

1 

0.179 

0.1689 

2 

0.063 

0.0630 

3 

0.019 

0.0263 

4 

0.010 

0.0116 

5 

0.010 

0.0053 

6 

0.002 

0.0025 

7 

0.000 

0.0012 

8 

0.002 

0.0006 


4.33. a) 0.0189; b) 0.0180; la ocurrencia es poco probable 


Capitulo 5 

5.3. a) 0.4649; b) 0.2204; c) 0.0228; d) 0.8643 

5.5. a) 1.775; b) 18.225; c) 21.65; d) -1.65; e) 0.2: J) 19.8 

5.7. 1018 

5.9. 0.00069 

5.11. 0.000008; la ocurrencia es muy poco probable 
5.13. $228 000 

5.15. a) 0.0256; b) =0; c) =0 

5.17. Si, la probabilidad de ocurrencia es virtualmente cero. 

5.19. a) 0.5774; b) no 
5.21. a) = 4, b = 16 
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5.23. b) E(X) = 0.75, VaRX) = 0.0375, D.M. (A") = 0.1582, a 3 UO = ,-0.8607, 
a 4 ( X) = 3.0952 

c) 0.6679, 0.9523; d) 0.63/0.7937,CJ.9086 •‘ fi31crrr " M *' 

5.25.0.64,0.9728 !<■ : : ■ : ' 

5.27.0.1314,0.0582 

5.29. a) 0.594; b) 0.0466; c) 0.2642 ' V J ■'!•*** ■ » 

5.31. a = 3.75, 0 = 8 
5.35. 0.9409 

5.37. a) E(X) = 44.3113; 16.23, 23.62, 29.86, 35.74, 41.63, 47.86, 54.86, 63.43, 75.87 

b) 0.1054 

5.39. a) 0.3679; b) 0.8647, 0.9502 

5.41. a) 0.1353; b) 433 

5.45. Exponential con parametr^ de escala 9“ 


Capitulo 6 

6.1. 0.0022; la ocurrencia es poco probable 

6.3. a) F(x, y) = (3.ry - xy 2 - 3jc 2 + Jt - 3y + y 2 + 2)/10 

b) 0.225 

c) F x (x) = (3jc - 1)U - l)/5, F Y (y) = ( 9y - y - 8)/10 

d) fxW = (6x - 4)/5 ,f r (y) = (9 - 2y)/10 

6.5. a) p x U) = Pr(y) = 5/16, 6/16. 5/16, jc = y = -1, 0, 1, respectivamente 

b) no; c) 0 

6.7. a/ 0.69; b) f T (t,) = (1/5) exp (-/,/5),/ r (/ : ) = 10exp( - 10/ 2 ) 

6.9. 1029.2152 

6.13. Si Cov( X, Y) > 0, VaRX + K) > VaiiX ) + VaRY) y ttfdA" — Y) < VaRX) + 

VaRY)\ si Cov(X , K) < 0, VaKA' + Y) < VariX) + VariY), y VaiiX - Y) > 

VariX) + VaRY) 

6.15. 11/27 

6.17. a) p. = 0.04, cr = 0.0014769; b) f(p | .r) = 1260p(l - p)' 4 

c) p. = 0.054, cr 2 = 0.0013456: d) 0.5432 

6.19. a) 1/2; b) 50 _ 

c) fix | y) = exp{-(l/!50)U - 50 - (y - 25)/2] 2 }/V1 - s 0tt 

d) f{x | K = 30) = expf-(l/!50)U - 52.5) 2 ]/\/150 tt. 0.9251 


Capitulo 7 

7.3. a/ exp ( - /7\)/n jt,!; b) p"( I - p)' ri 

c/ 1/(6 - «)"; d) ( 1 /cry/lir)" exp [ - S(.r, - /u.) : /2cr 2 ] 

7.5.' Partes c/, 6/, y ./) 

7.11. 0.0075 
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7.15. a) 0.7698; b) 0.9986; c) 0.054$; d) 0.0228 
7.17. =0; el inspector debe emprender la action apropiada 
7.19. 255.82 
7.23. 0.99 

7.25. Muy poco probable P(T > 3.429) < 0.005 
7.27. Si; P(T < -3.516) < 0.001 
7.29. Dudoso; P(F iyx > 1.999) < 0.10 


Capitulo 8 

8.1. a) ECM(I,) = p( 1 - p)/«;ECM(7 2 ) = [np( 1 - p) + (2 p - 1 f]/(n + if 

b) No. Para n = 10, si 0.138 < p < 0.862, ECM(7 2 ) < ECM(7|); de otro modo 
ECM (TJ < ECM(7 2 ). Para n = 25, si 0.142 < p < 0.858, ECM(7 2 ) < ECMIT,); 
deotro modo, ECM(7,) < ECM(7 2 ) 

8.5. 7 3 ; Var(T})/VaiiTi) = 0.9 

8.9. k = X 

8.11. a- 2 = SA'f/2 n; si 

8.13. Los factores de la muestra de forma son — 0.0028 y 2.21, respectivamente; la distribu¬ 
tion es, es forma aparente, simetrica y ligeramente plana en su parte superior. 

8.15. a) d = 100.0696; b) si, 9 = 103.575; c) 0.1057 

8.17. a) 2532.7; b) 0.2061 

8.19. a) 214.9289; b) 0.8410, 0.5340 

8.21. (20.1191, 20.6434) 

8.27. (151.31, 165.69), (149.75, 167.25), (147.82, 169.18) 

8.31. (-3.89, - 1.51), (-4.12, - 1.28), (-4.58, -0.82), si 
8.33. (4.84, 21.16), (2.07, 23.93), si 
8.35. (146.98, 645.69) 

8.39. (0.2048, 4.0744), si 

8.41. (0.0172, 0.0628), (0.0128, 0.0672), (0.0043, 0.0757); existe una razon paradudar det 
la afirmacion 

8.43. 663 8.45. a) 88; b) (66.40, 109.60) 

8.47.(2.98514,3.01486) 8.49.0.8609,299 8.51.152 

Capitulo 9 

9.1. Prueba b 

9.3. a) H a : p = 0.05 contra H,: p > 0.05; b) 0.2642 

c) 0.3396, 0.4831, 0.6083, 0.8244, 0.9308, y 0.9757, respectivamente 

. d) a — 0.0755, la potencia es 0.1150, 0.2120, 0.3231, 0.5951, 0.7939 y 0.9087, 
respectivamente. 
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9.5. Los valores criticos para la prueba 1 son 19.8333 y 20.1667; para la prueba 2 estos son 
19.7917 y 20.2083. 


Poiencia 



19.5 

19.6 

19.7 

19.8 

19.9 

20.0 

20.1 

20.2 

20.3 

20.4 

20.5 

Prueba I 
Test 2 

xl- 

0.9998 

0.9974 

0.9893 

0.9452 

0.8643 

0.6554 

0.4602 

0.2126 

0.0968 

0.0456 

0.0124 

0.2126 

0.0968 

0.6554 

0.4602 

0.9452 

0.8643 

0.9974 

0.9893 

= 1 

0.9998 


9.7. El extremo izquierdo de la distribuci6n de muestreo de X 
9.9. a) H 0 : k = 2.5 contra H t : X < 2.5 

b) Para las cuatro semanas, el valor critico es 5 

c) 0.8088 

9.11. No puede rechazarse // 0 , ya que x = 145 < i 0 = 233.8 
9.13. 30 
9.15. 7 

9.17. 100.62; H 0 no puede rechazarse si el valor propuesto es 3= 10C.62 

9.19. aj Valores relativamente grandes de raanera que es facil rechazar H 0 

b) t = 0.667; H 0 no puede ser rechazada con a = 0.1; el valor p es mayor que 0.2 

c) Si; los valores extremos pueden ser criticos 

9.21. t = 0.54; H 0 no puede rechazarse 

9.23. a) Si; el valor critico es tres, el valor p es 0.0755 
b) z = 2.05 y H 0 se rechaza, el valor p es 0.0202 

9.25. z = -3.54, H 0 se rechaza 

9.27. z = 1.62, H 0 no puede rechazarse, el valor p es 0.1052 
9.29. [(z t _, + z,, a )M + a 2 r )]/(6 0 - 8,) 2 
9.31. t = — 1.36, H 0 no puede rechazarse; el valor/* es 0.19 
9.33. t = -1.729, H 0 no puede rechazarse 

9.37. a) t = 2.11, H 0 se rechaza; b) el valory? es 0.039; c) (1.66, 7.84) 

9.39. x 2 = 17.28, H 0 no puede rechazarse 

9.41. Aproximadamente 0.1 

9.43. a) x 1 - 47.04, H 0 se rechaza 

b) los valores en el intervalo (1.8083, 7.1666); no son equidistantes debido a que la 
distribucion de muestreo no es simetrica 

9.45. a) f — 3.24, H a se rechaza; b) 0.1374 

9.47. z = 3.03, H v se rechaza; el valor p es 0.0012 

9.49. z = 1-33, H a no puede rechazarse; el valor p es 0.1836 

Capitulo 10 

10.1. x 2 = 12, H 0 se rechaza; el valor p es aproximadamente 0.008 

10.3. a) x - 400, Ho se rechaza; la conclusion es diferente a la del ejercicio 10.2 

10.5. x 2 = 40, H„ se rechaza 
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10.7. x 2 = 4.25, //„ no puede rechazarse 
10.9. a) x 2 = 5.8501, //„ no puede rechazarse 

b) X = 2.673, x 2 — 5.8%9, y H 0 a pesar de lo anterior, no puede rechazarse 
10.11. La desviacion maxima es 0.1263, H 0 no puede rechazarse 
10.13. x\ = 1.0097 (para k = 5 clases), H 0 no puede rechazarse 
10.15. x 2 = 7.8628, H 0 no puede rechazarse 


10.17. 

2.16 

3.78 

2.70 

1.36 


2.60 

4.54 

3.24 

1.62 


3.24 

5.68 

4.06 

2.02 


10.19. x 2 = 22.04, H 0 serechaza 
10.21. x 2 = 2.69, H 0 no puede rechazarse 


Capitulo 11 

11.1. a) (4.3292, 5.6708), e' promedio de la muestra de la decimoprimera semana es mayor 
que el valor del llmite de control superior 
b) probabilidad ~0; c. 0.0301 

11.3. a) (475.5051, 524.4949), no; b) 0.9884; c) (0.574, 37.486) 

11.5. 0) (378.36, 422.04), (0, 31.96); b) 16.28 
11.7. a) (0, 0.0797); b) (0, 0.0758); c) 0.0013 
11.9. a) 0.6767; b) 0.5438 
11.11. 0.5526 

11.13. Aproximadamente 0.175 

11.15. n = 99, c = 4; n = 131, c = 5; n - 100, c■ — 4; n = 116, c = 5 
11.17. a) 0.3679; b) 0.019; c) 0.3971; d) 0.216 
11.19. n = 65, x u = 71.53 


Capitulo 12 


2.5. Fuente 

g! 

SC 

CM 

Valor F 

Tratamientos 

2 

0.492 

0.246000 

43.41 

Error 

12 

0.068 

0.005667 


Total 

14 

0.560 

./(I 95.2.12 = 

3.89 


12.7. a) Fuente gl SC CM Valor F 


Tratamientos 

3 

2305.5 

768.50 

2.75 

Error 

28 

7838.0 

279.93 


Total 

31 

10143.5 

/o.95.3.2H 

= 2.95 


b) Los residuos estandarizados no sugieren varianzas desiguales. 
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12.9. a) Fuente gl SC CM Valor F i 

Tratamientos 4 522,744 130,686 66.41 

Error 20 39,360 1,968 

Total 24 562,104 = 4.43 

b) Algunos contrastes y sus intervalos de conflanza son: L, = p s - /x 4 , (41.87, 278); 
L 2 = 3/J-5 - M’ - Mj - /x 4 , (406.65, 985.35); L, = p 2 - p„ (33.87, 270.13); . 
L 4 = 2/i, - /xj - /*„, (205.39, 614.61); L, = M , - M ,, (-82.13, 154.13) 

12.11. El uso del anilisis de varianza es cuestionable debido a que la variation en el interior de 
la region es demasiado grande para ser atribuida solo a un error aleatorio. 

12.13. b) Y,j = p + p, + Tj + Bjj, i = 1, 2.5, j = 1, 2, 3, 4; //„: t 2 = Opara today; 


Fuente 

gl 

SC 

CM 

Valor F 

Bloques 

4 

1026.2875 



Tratamientos 

3 

17.6260 

5.8753 

41.09 

Error 

12 

1.7165 

0.1430 


Total 

19 

1045.6300 

_/(>.9.V3.12 : 

= 3.49 


c) Algunos contrastes y sus intervalos de confianza son L ] = 3p 4 - /x, - p 2 ~ M 3 » 



(4.48, 8.28) 

; L 2 = 

p 4 - /x,, (1.57 

, 3.11); L } 

il 

J 

+ 


A-4 = M3 — 

(- 

0.41, 1.13) 



a) 

Yu = M + 

A + T j 

+ e,j , / = 1, 

2, ...,7,y 

= 1, 2, 

b) 

Fuente 

gl 

SC 

CM 

Valor F 


Bloques 

6 

1,471,772.429 




Tratamientos 

3 

44,826.572 

14,942.19 

16.48 


Error 

18 

16.316.428 

906.47 



Total 

27 

1,532,915.429 

A 95.3. IK 

3.16 


c) f = 16.48 > /o. 9 ,.,. 6 = 5.99; H 0 a pesar de esto se rechaza 

d) Dos contrastes y sus intervalos de confianza son: L, = p, — p 2 , (12.01, 
111.13); L, = p 2 - /x 4 , (-29.13, 69.99) 

12.17. a) Y ijk = p + a, + Pj + {apXj + e ijk , i = 1, 2 ,j = 1, 2, k ~ 1, 2, 3 

b) // n : (a)3)„ = 0 para toda / y// 0 : a, = 0 para toda /' yy; //„: Pj = 0 para toda j 


Fuente 

gl 

SC 

CM 

Valor F 

Horno 

1 

0.022534 

0.022534 

3.92 

Temperatura 

1 

0.005634 

0.005634 

0.98 

Horno x Temp 

1 

0.554699 

0.554699 

96.47 

Error 

8 

0.046000 

0.005750 


Total 

11 

0.628867 

II 

X 

3- 

5.32 


1219'. a) Y iJk = p + a, + p, + («/3)„ + e ijk , i = 1, 2. 3, 4,y = 1. 2, 3. A = 1, 2, 3, 4 
b) //,>: cr,; fl = 0; //„: a, = 0 para toda /; //„: o-„ = 0 
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Fuente 

g> 

SC 

CM 

Valor F 

Variedades 

3 

331.750 

110.58 

0.64 

Fertilizantes 

2 

22,764.875 

11,382.44 

230.65 

Variedades x 

Fert. 

6 

1,052.125 

173.35 

3.51 

Error 

36 

t 

1,776.500 

49.35 


Total 

47 

25,925.250 

fn.w.i.h ~ 4-^6 


/o.»5.2.36 ~ 3.27 fy 9 .S. 6 . 3 A _ 2.37 


Capitulo 13 

13.3. a) ZYiXi/lxh b) E(B ) = 0 


13.5. a) En algun grado; b) y = 2.50 + 1.7774* 

<9 Para cualquier aumento de $1 000 en el ingreso familiar, la cobertura del seguro de 
vida tambien aumenta. 
d) Debe ajustarse una ecuacion cuadratica 


13.7. 


13.9. 


X 

45 20 

40 

40 

47 

30 

25 

20 

15 

residuos 

-12.48 11.95 

-13.60 

-23.60 

3.96 

-0.82 

8.06 

-3.05 

10.84 

X 

35 40 

55 

50 

60 

15 

30 

35 

45 

residuos 

0.29 1.40 

4.74 

18.63 

10.85 

0.84 

- 15.82 

0.29 

-2.48 

124.7; d) 7.727, 0.2021; 

e) (1.3489, 2. 

2059); 

f) Si, t 

= 8.79 



Intervalo de confianza 

x . 

Intervalo de confianza 




45 

(75.67, 89.29) 

35 

(59.11, 

70.31) 





20 

(29.23, 46.87) 

40 

(67.75, 

79.45) 





40 i 

(67.75, 79.45) 

55 

(90.38, 

110.14) 





40 

(67.75, 79.45) 

50 

(83.17, 

99.57) 





47 

(78.73, 93.35) 

60 

(97.43, 

120.87) 





30 

(49.69, 61.95) 

15 

(18.60, 

39.72) 





25 

(39.65, 54.23) 

30 

(49.69, 

61.95) 





20 

(29.23, 46.87) 

35 

(59.11, 

70.31) 





15 i 

(18.60, 39.72) 

45 

(75.67, 

89.29) 






x p Vpan intervalo de prediction del 95 % 


18 

34.49 

(8.98. 

60.00) 

28 

52.27 

(27.71, 

76.83) 

38 

70.04 

(45.70, 

94.38) 

48 

87.82 

<62.95, 

112.69) 

58 

105.59 

(79.50, 

131.68) 


13.11. b) 0.2262; la asociacion lineal es vaga 

13 . 13 . a) (cr/ri) « Var(Y p ) *s 2(a 2 /n); 

b) [(n + 1 )ct 2 /a?] Vr/rf P par ,) « [(n + 2)c r/n}\ 

c) b 0 = 15.5, 6, = 5.1 
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13.15. b) 

y = 12.75 + 

19.875*; c) 

> sl, / = 

14.24; d) (16.881, 22.869) 

13.17. a) 

r = -0.8829 




b) 

Fuente • 

gl sc - 

CM 

Valor F' '- • ; ' v ' 


Regresi6n 

1 5.64305 

5.64305 

63.65 


Error 

18 1.59595 

0.08866 



Total 

19 7.23900 

/o.W.1.18 

= 8.29 

13.19. a) 

y = -53.119 

+ 0.6639*; 

b) si 



c) se detecta una autocorrelation positiva d = 0.7075 

d) y = -45.116 + 0.6704* 


Capitulo 14 

14.1. a) p 2 es no lineal 

14.3. a) 3; b. -3.5 

14.5. a) Variable ert 

el modelo b„ b, b 2 

x, 0.1619 0.1342 

* 2 0.6713 -0.0363 

*,,*2 - 0.1605 0.1487 0.0769 


14.7. 


b) / = 113.14, rechazar H 0 

c) SCR(x 2 | x,) = 0.0879,/ = 14.63; SCR(x, | x 2 ) = 1.3366,/ = 222.47 

d) R 2 = 0.94% 

e) y = -0.1605 + 0.1487*, + 0.0769 x 2 , y p = $518.85, ($462.7, $575.0) 


15 42.00 55.0" 


&0 


" 8.070" 

42 188.08 140.8 


b, 

= 

32.063 

55 140.80 219.0 


lb 2 ] 


28.960 


14.9. a) Variable 


en el modelo 

R 2 

SCE 

CME 

c P 

*, 

0.000 

7326 

407.02 

114.07 

x 2 

0.229 

5648 

313.77 

84.27 

x, 

0.784 

1581 

87.82 

12.06 

x , 

0.748 

1846 

102.53 

16.76 

x u x 2 

0.230 

5641 

332.00 

86.20 

JC|, Xx 

0.802 

1451 

85.34 

11.75 

X |» Xi 

0.754 

1800 

106.00 

17.97 

X 2 , Xx 

0.785 

1576 

92.73 

13.99 

x 2 , x 4 

0.774 

1653 

97.20 

15.36 

x,. *4 

0.869 

958 

56.34 

3.00 

X 1 , X 2 , Xy 

0.802 

1451 

90.70 

13.77 

X \, x 2> ,r 4 

0.778 

1624 

102.00 

16.85 

X\ , Xy, x A 

0.885 

846 

52.88 

3.02 

X 2 , Xy, X A 

0.870 

950 

59.38 

4.87 

X,, X 2 , Xy, X A 

0.885 

845 

56.33 

5.00 
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c) y = -114.988 + 1.2657*3 + 0.8414*4, >v, = 100.35,(82.05, 118.64) 
14.11.0.0654 , 0.0952 

14.13. La grafica revela una tendencia cuadr&tica y = 8.238 + 0.3126* — O.OOI823* 2 ; y = 
- 27.55%, lo cual es absurdo " v 

14.15. a) y = 5284.28 - 114.85*, - 78.67* 2 + 0.129* 3 + 0.189*? + 0.201*? + 2.63 x 
10' 7 *? + 1.268*!*2 — 0.0017*!*3 — 0.0008* 2 * 3 
b) La elecci6n para la mejor ecuacion se encuentra entre las dos siguientes: 
y = 2163.98 - 56.47*, - 26.17* 2 + 0.0162* 3 + 0.6952*,* 2 - 0.0005*,* 3 
y = 1676.19 - 43.57*, - 19.77* 2 + 0.526*,* 2 - 5.91 x 10“ 5 *,* 3 



Y 


*2 

X) 

*4 


Y 

1.00 

0.18 

0 78 

0.15 

0.29 

0.45 


0.18 

1.00 

-0.05 

0.41 

0.55 

-0.04 

*2 

0.78 

-0.05 

1.00 

0.08 

-0.30 

0.16 

•Tj 

0.15 

0.41 

0.08 

1.00 

0.27 

-0.14 


-0.29 

0.55 

-0.30 

0.27 

1.00 

-0.11 

*5 

0.45 

-0.04 

u. 16 

-0.14 

- 0.11 

1.00 


Capitulo 15 

15.1. Si, / = -2.12 y se rechaza // 0 

15.3. z= - 2.51, H 0 se rechaza 

15.5. z = — 2.80 y, por lo tanto, existe una razon para creer que la secuencia no es aleato- 
ria. 

15.7. z = 2.24 y la H () de que no existe diferencia entre la preferencia se rechaza. La conclu¬ 
sion es diferente a la del ejercicio 15.6. 

15.9. s = 4, los valores criticos son 2 y 10, no puede rechazarse H a 

15.11. h = 11.40 y se rechaza la hipotesis // 0 de que las distribuciones son identicas para am- 
bas disciplinas. 

15.13. s = 1.1 ylas diferencias entre las cuatro pruebas no son estadisticamente significati- 
vas. 

15.15. r s = 0.7915 

15.17. r s = -0.4667; existe alguna tendencia en uno de los jueces para dar un puntaje alto 
cuando los demas lo dan bajo. 
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alternativa, 307 
bilateral, 311 
compuesta, 304 
sencilla, 304 
unilateral, 311 
Histograma, 3 
Hoja de control: 

para desviacion estandar, 384, 385 
para medias, 381, 384 
para proportion, 388 

lndependencia estadistica de eventos, 41 
de variables aleatorias. 194 
Inferencia: 
estadistica, 214 
inductiva, 2 
Interaction, 426, 427 
Intervalo de prediction, 469, 509, 510 
Intervalos de confianza: 
para medias, 274, 278, 279 
para proporciones, 282, 350 
para varianzas, 280, 281 

Jacobiano, 168 

Lema de Neyman-Pearson, 315 
Ley de los grandes numeros, 258 
Limites: 
de clase, 3, 6 
de tolerancia, 150 
para distribuciones normales, 293 
independientes de la distribucion 290 


Media: 

calculo de la, 11, 12 
definition teorica de la, 75 
distribucibn de muestreo para la, 224, 
225 

intervalo de confianza para la, 267, 274 
prueba de hipotesis para la, 327, 333 
Mejor conjunto de variables de 
prediction, 525 

Mejor estimador lineal no sesgado, 455 

Mejor prueba, 314 

Metodo: 

de los momentos, 268 
de Scheffe, 413 
Metodos: 

independientes de la distribucion, 249, 
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no parametricos, 573, 574 
Minimos cuadrados con factores de peso, 
535, 548 
Moda, 12 
Modelo: 

autorregresivo, 514 
curvilineal, 504, 538 
de efectos aleatorios, 406 
de efectos fijos, 406 
heterosedastico, 535 
lineal general, 503 
de primer orden, 504 
Momentos: 
factoriales, 95 

de una variable aleatoria, 67-69 
de distribuciones bivariadas, 191 
de muestras, 268 
Muestra aleatoria, 217 
Muestreo para aceptacion: 
por atributos, 392 
por variables, 393 
Multicolinealidad, 510, 520 

Nivel de calidad aceptable, 392 
Notation de suma, 25 

Observaciones discordantes (aberrantes o 
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Parametro, 1 
definition de, 218 
tipos de, 88 
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Permutaciones, 45 
Poblaci6n, 1 

Principio: ; ' ■.- v : I ,. 

de aleatorizacibn, 341 
de la suma cuadrada extra, 513 
Probabilidad: 
condicional, 37 > 

conjunta, 36 

definicion clasica dela, 29 
definicion de frecuencia relativa de la, 
30 

interpretation subjetiva de la, 31 
marginal, 37 

a posteriori o posterior, 44 
a priori o inicial, 44 
Proportion: 

defectuosa tolerable en un lote, 392 
diferencia de dos proporciones, 350 
intervalo de confianza para 390 
Prueba: 

para corridas de Wald-Wolfowitz, 577 
estadistica, 306 
F conservadora, 102 
F partial, 516 
de hipotesis estadistica, 303 
de Kruskal-Wallis, 582 
de Mann-Whitney, 574 
para observaciones pareadas, 340 
del rango signado de Wilcoxon para la 
suma, 580 
del signo, 579 

uniforme mas poderosa, 317 
de Wilcoxon para el rango de la suma, 
574 

Rango, 573 

de correlation de Spearman, 586 
Recorrido, 20 
intercuartil, 20, 77 
interdecil, 20, 77 
Region critica, 306 
Regia: 

de adicion de probabilidades, 35 
de multiplication para probabilidades, 
38 

Regresion: 
curva de, 445 
curvilineal, 538 
lineal multiple, 503 


para el modelo lineal general, 503 
para el modelo lineal sencillo, 465 
paso a paso, 526, 527, 532 
significado de la, 444 
suposiciones para la, 446 
Repaso de algebra matricial, 497 
Residual, 415, 452 
estandarizado, 416 
varianza, 455 
Riesgo: 

del consumidor, 391 
del fabricante, 391 
Robusto, 338 

Sensibilidad, 338 
Series, de tiempo, 479 
Sesgo, 253 

Suma de cuadrados, 409, 472 

Tablas de contendencia, 371 
Tecnicas de relation de variables, 525 
Tendencia central, 12, 75 
Teorema: 

de Bayes, 43, 44, 200 
de DeMoivre-Lapace, 141 
del limite central, 230, 247, 248, 
de Tchebusheff, 257, 258 
Tratamiento, 402 

Valor: 

esperado, 197 
condicional, 198 
propiedades del, 65-67 
P, 326 

Valores aleatorios, generation de, 171 
para la distribution binominal, 174 
para la distribution normal, 174 
para la distribution de Poisson, 175 
para la distribution de Weibull, 173 
Variable 
aleatoria, 52 
continua, 53 
discreta, 53 

distribution de una funcion de, 167, 
168 

estandarizada, 73 
de prediction, 444 
de respuesta, 444 
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Variables: 
de indication, 556 
ortogonales, 520 
Variaci6n, 15, 76 
coeficiente de, 69 


Varianza: 
calculo de la, 15 
definition teorica de la, 68 
iniervalos de confianza para, 280, 281 
prueba de hipbtesis para, 346, 347 
Violation de suposiciones, 338 
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